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前 言 

近年来金融时间序列这个研究领域已经引起了人们广泛的关注,尤其是当2003 
年 Robert Engle 教授和 Clive Granger 教授获得诺贝尔经济学奖之后.与此同时. 
金融计量经济学领域也有了新的发展，尤其是在高频金融、随机波动率以及可用性 
软件方面.于是我们需要为高年级本科生、研究生、技术人员以及研究人员提供一 
套更为完善易愤的素材.在准备第2版时我们的主要目的是在新的发展和实证分 
析方面进行更新，并且扩大这本书的核心素材，将异方差和序列相关存在时的相合 
协方差估计、波动率建模的备选方法、金融因子模型、状态空间模型、卡尔曼滤波 
以及随机扩散模胡的估计也包含了进来. 

因此本书扩展到了 12章,而且本书另一个重要的修改是包含了 S - Plus 命令和 
说明.木版同时更新了许多实证例子和练习，使其包含了最近的数据 

新增的两章是第0章主成分分析及因子模型，与第 1] 章状态空间模型和卡尔 
曼滤波.本书所讨论的因子模型包含了宏观经济因子模型、基本面的因子模型和统 
计因子模型.对于分析像组合收益这样的高维佥融数据，这些模型是简单而有力的 
工具.为说明其应用，本 t 5 给出了实证的例子.新增的状态空间模型和卡尔曼滤波 
是为了阐明其在金融中的应用以及容易计算的特点.笫12章中，在一般马尔科夫 
链蒙特卡罗 ( MCMC ) 框架下，状态空间模型和卡尔曼滤波可用来估 il 随机波动率 
模型.该佔计还用到了向前滤波和向后抽样的方法以增加计算效率. 

下面我们对第2版新增的内容给出一个简要概括. 

(1) 吏新/全书所用的 数据. 

( 2 ) 给出了 S - Plus 命令和演示. 

(3) 第2章考虑了单位根检验以及存在异方差和序列相关时协方差矩阵的相 
合估计方法. 

(4) 第3章描述了波动率建模的备选方法，包括应用高频交易数据以及一项资 
产的日最高价和日最低价. 

(5) 第1章给出了非线性模型和方法的更多应用. 

(6) 第7章引入了更多风险值的概念和应用. 

(7) 第8章讨论了协整向量自回归模型. 

(8〉第10章涵盖了各种多元波动率模型. 

(9) 第12章中增加了有效的 MCMC 方法来估计随机波动率模型. 

本次修改主要得益于同事，朋友以及许多第1版读者们富有建设性的意见.我 




2 前言 
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第 1 版前言 

本书来源于自1999年以來我在芝加哥大学商学院所教的 MDA (工商管理硕 
丄）金融时间序列分析课程.它也包含了过去几年我丌设的时间序列分析博士生课 
程的素材.这是一本引论性质的书，旨在对金融 il 量经济模型及其在金融时间序列 
数据的建模和预测中的应用进行综合与系统的阐述.本书的0的是使读者了解金 
融数据的基本特征、理解金融计量经济模型的应用并获得分析金融时间序列的经 
验. 

本书可作为金融专业 MBA 学生的时间序列分析教材，也适用于商学、经济学、 
数学和统计学专业对金融计量经济学感兴趣的高年级本科生和研究生.同时，它也 
可作为商业、金融、保险领域中要进行风险值 ( VaR , Value at Risk ) 计算、波动率 
( volatility ) 建模和对具有序列相关性的数据进行分析等工作的研究人员和业内人 
士的参考书. 

对计量经济学和统计学文献中的金融计量方法的最新进展进行概述是本书的 
突出特点.这些进展包括当前的研究热点，如风险值、高频数据分析和马尔可夫链 
蒙特卡罗 ( MCMC ) 方法等.特别地，本书包含了一些在学术杂志上尚未发表的最 
新研究成果，可参阅第 fi 章中关于使用封闭形式的跳跃扩散方程来进行衍生产品 
的定价.第7章中基于非齐次一维泊松 ( Poisson ) 过程的极值理论计算风险值，以 
及第9章中带时变相关系数的多元波动率模型等.本书之所以介绍 MCMC 方法， 
是因为这类方法在金融计量经济学中是强有力的工具，并且对其有大量的应用. 

强调实例和数据分析是本书的另一个突出特点.全书采用实际金融数据来说 
明所讨论模型和方法的应用.我们的分析用到了多种计算机 软件： 线性吋间序列 
的建模用 SCA(Scientific Computing Associates , 科学计算助乎)；估计波动率模型用 
KATS(Regression Analysis for Time Series , 时间序列的回归分析)；实现神经网络和 
绘制 PS 格式的图形用 S - Plus . 运行这些软件包所需的一些命令将在相应各章后 
的附录中给出.特别地，用来估计多元波动率模型的复杂的 RATS 程序在第9章的 
附录 A 中给出.其中有些我和其他人编的 Fortran 程序可用来对简单的期权定价、 
估计极值模型、计算风险值和进行贝叶斯 ( Bayesian ) 分析.一些数据和程序可以在 
万维网上获得.网址为： http :// www . gsb . uchicago . edu / fac / ruey . tsay/teaching 
/fts 

本书第1章描述了金融时间序列数据的一些基本特征.其他各章分为三个部 
分： 第一部分由第2章至第7章组成,讨论一维金融时间序列的分析及 应用； 第二 




2 第 1 版前言 __ 

部分包括第8章和第9章，是关于多项资产收益率序 列的； 最后一部分是第10章， 
介绍用 MCMC 方法进行金融中的贝叶斯推断. 

完全读懂本书需要具备基本统计学的概念和知识.在每章中，当一个必要的统 
计学概念第一次出现时，我都给出了 -个简短的回顾.即使如此，统计学或商业统 
计学的必备知识，包括概率分布、线性回归分析，还是竭力推荐的.金融知识对理 
解书中所讨论的应用是很有帮 助的. 然而，对具有很好的计量经济学和统计学背景 
的读者来说，也会在本书中发现多方面有趣的主题和带挑战性的问题 

作为 MBA 的课程，第2章和第 3 章是核心内容，另外还可加入一些非线性方 
法的内容（如第4章的神经网络及第5〜7章和第10章中讨论的应用).对贝叶斯 
推断感兴趣的读者可以从第10章的前 5 节开始阅读- 

金融时间序列分析的研究发展迅速，新成采不断 出现. 虽然我已经力图覆盖尽 
口 J •能广的内容，但仍有许多土题没有涉及或只是一带而过. 

我真诚地感谢我的老师和亲密的朋友 George C . Tiao , 是他在这些年中给了 
我指导和鼓励，让我有了对统计应用的坚定信念.感谢 Steve Quigley , Heather 
Haselkorn , Leslie Galen , Danielle LaCourciere 和 Amy Hendrickson , 没有他们的帮 
助这本书是不可能出版的.感谢 Richard Smith 送给我极值理论的估计程序.感谢 
Bonnie K . Ray 对本书的几个章节都给出了非常有益的 建议. 感谢 Steve Kou 送给 
我他的关于跳跃扩散模型论文的预印本.感谢 Robert E . McCulloch 许多年来在 
MCMC 方法上的合作.感谢选修我的金融时间序列分析课程的许多学生的反馈和 
投入.感谢 Jeffrey Russell 和 Michael Zhang 关于高频金融数据的深入 讨论. 同时， 
也感谢芝加哥大学商学院和美国国家科学基金的支持.最后，对我的妻子 Teresa 的 
—贯支持、鼓励和理解，对 Julie , Richard 和 Vicki 给我带来的快乐和灵感以及对 
我的父母亲给我的关爱.表示我最衷心的谢意 • 


蔡瑞胸 （Ruey S . Tsay ) 

芝加哥大学 
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第 1 章金融时间序列及其特征 

金融时间序列分析考虑的是资产价值随时间演变的理论与实践.它是一个带有 
高度经验性的学科，但也像其他科学领域一样，理论是形成分析推断的基础.然而， 
金融时间序列分析有一个区别于其他时间序列分析的土要 特点： 金融理论及其经 
验的时间序列都包含不确定因素.例如，资产波动率有各种不同的定义，对一个股 
票收益率序列，波动率是不能直接观察到的.正因为带有不确定性，统计的理论和 
方法在金融时间序列分析中起重要作用. 

本书的目的是提供一些金融时间序列的知识，介绍一些对分析金融时间序列有 
用的统计工具，从而使读者获得各种经济计量方法在金融中应用的经验.第1章 
引入资产收益率的基本概念，并简要介绍本书所讨论的一些过程.第2章回顾了 
一些线性时间序列分析中的基本概念，如平稳性、自相关函数，引入了一些简单的 
线性模型来处理序列的序列相关性，并讨论了带时间序列误差、季节性、单位根非 
平稳性和长记忆过程的回归模型.当存在条件异方差性和序列相关时，该章给出 
了协方差阵相合估计的方法.第3章着重讨论了条件异方差性（资产收益率的条 
件方差）的建模，讨论了新近发展起来的用来描述资产收益率的波动率随时间演变 
的各种经济计量模型.该章还讨论了波动率建模的其他方法，包括使用高频交易数 
据和一项资产的日最高价格和日最低价格进行建模.第4章讨论了金融时间序列 
中的非线性性，引入了能区别非线性序列与线性序列的检验统计量，并讨论了几个 
非线性模型.该章还介绍了非参数估计方法和神经网络，并且展示了非线件模型在 
金融中的各种应用.第5章考虑的是高频金融数据的分析及其在市场微观结构中 
的应用，阐明了不同步（或不同时）的交易和买卖价格间的跳跃可能带来股票收益 
的序列相关性.该章还研究了不同交易之间持续时间的动态规律和一些分析交易 
数据的计量经济模型.第 S 章引入了连续时间扩散模型和伊滕 ( Ito ) 引理.导出了 
Black-Scholes 期权定价公式，并应用一个简单的跳跃扩散模型来刻画期权市场常见 
的一些特征.第7章讨论了极值理论、厚尾分布及其在金融风险管理中的应用.该 
章还特别讨论了汁算金融头寸风险值 （ VaR ) 的各种方法.第8章着重讨论多元时 
间序列分析和简单的多元模型，重点在于分析时间序列之间的交叉延迟关系.该章 
还介绍了协整、一些协整检验以及门限协整.并用协整的概念来研宄金融市场屮的 
套利机会.第9章讨论了简化多元时间序列动态结构的力法和降低维数的方法，并 
介绍和演示了 3种因于模型来分析多个资产的收益率.第10章介绍/多兀波动率 
模型，其中包括带时变相关系数的模型，同时还讨论 f 怎样对一个条件协方差阵进 
行重新参数化,使之满足正定性的限制，并降低波动率建模的复杂性.第11章介绍 
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了状态空间模型和卡尔曼滤波.还讨论了状态空间模型和本书中所讨论的其他计量 
经济模型之间的关系.该章还给出了在金融方面应用的几个例子.最后，第12章介 
绍了统计文献中一些新近发展起来的马尔可夫链蒙特卡罗方法，并把这些方法应用 
于各种金融研究的问题，如随机波动率模型和马尔可夫转换模型的估计. 

本书着重强调应用和实证分析.每章都有实际例子，很多时候经济计量模型的 
发展是由金融时间序列的实证特征来推动的.必要时，本15还提供了用束分析数据 
的计算机程序和命令.在某些案例中，程序已在附录中给出.书中各章的练习题也 
要用到很多实际数据. 


1.1 资产收益率 


多数金融研究针对的是资产收益率而不是资产价格. Campbell , Lo 和 MacKin - 
lay (1997) 给出了使用收益率的两个主要 理由： 第一，对普通的投资者来说，资产收 
益率完全体现了该资产的投资机会，且与其投资规模 无关； 第二，收益率序列比价 
格序列更容易处理，因为前者有更好的统计性质.然而，资产收益率有多种定义. 

设朽是资产在 t 时刻的价格.下面给出全书中要用到的一些收益率的定义.暂 
时假定资产不支付分红. 

羊期简单收益率 

若从第 《 - 1天到第 t 天（一个周期）持有某种资产，则简单毛收益率为 

l + = ^ -或 P l = P t - i{l + R t ). (1.1) 

对应的单期简单净收益率或称简单收益率为 


多期简单收益率 

若从第< - ik 天到第 < 天这 A ： 个周期内持有某种资产，则 A > 期简单毛收益率 


+ Rt [fe] 


Pt Pi 
Pt-k Pt -\ 


k -1 

n(i+u. 


这样,期简单毛收益率就是其所包含的这 / k 个单期简单毛收益率的乘积，称为复 
合收益率 . A > 期简单净收益 率是恥 [ fc ] = ( 巧- Pt - k ) / Pt - k . 




1.1 资产收益率 3 


在实际中，确切的时间区间对讨论和比较收益率是非常重要的（例如是月收益 
率还是年收益率).若时间区间没有给出.那么就隐含地假定时间区间为1年.如果 
持有资产的期限为 fc 年,则（平均的）年化收益率定义为 


年化的{柘 ㈨ }= 


n ( i + 柘勺） 

i=o 


1A 


这是由它所包含的这 A 个单期简单毛收益率的几何平均得到的，可以用下式 计算: 


年化的{佐[灸]} = ex P T + -1， 

其中 cxp ( r ) 表示指数函数， ln (： r ) 是正数 a ; 的自然对数.因为计算算术平均值比计 
算几何 f 均值容易，并且单期收益率般很小，我们可以用一阶泰勒 ( Taylor ) 展开 
来近似年度化的收益率，得到 


年化的 


(1.3) 


3=0 


然而，在有些应用中. (1.3) 式近似的精度可能不够. 

连续复合 

在引进连续复合收益率之前 T 我们讨论一下复合的效果.假定银行存款的年利 
率为10%,最初存款为1美元.如果该银行每年支付一次利息，那么1年之后存款 
的净值变为1美元 x(l + 0.1) = 1.1 美元.如果该银行半年付息一次，6个月的利 
息率是10%/2 = 5%,第1年之后净值是1美元 x (1+ 0.1/2) 2 = 1.102 5美元.一般 
地，如果银行1年付息 m 次,那么每次支付的利息率为 10 %/ m , 1年后存款的净值 
变成1 x ( l +0.1/ m) m 美元.表 1-1 给出了年利率为10%时一些常用的时间间隔 
下存款1美元的结果 


表 1-1 

类 型 

季度 

n 

m 

天 

连续地 


复合效果的演示（期限为1年，年利率为10%) 

~支付次数 毎期的利率 


365 



0.1/52 

0.1/365 


净 值 


S1.100 00 
S1.102 50 
S1.1U3 81 



S1.105 16 
$1.105 17 
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特别地，净值趋于 1.1052 美元《 exp (0.1) 美元,这个倌就是连续复合的结果.于是, 
我们可以清楚地看到复合的效果. 

一般地，连续复合的资产净值 .4 为 

A = Cexp(r x n), (1.4) 

其中 r 是年利率， C * 是初始资本, n 是年数①.由 （ L 4) 式,我们有 

C = A exp (― r x n ), (1.5) 

称作 n 年后价值为 X 的资产的现值，这里我们假定连续复合的年利率为 r. 

连续复合收益率 

资产的简单毛收益率的自然对数称为连续复合收益率或对数收益率 ( log - retum ) 

r< = In(1 + /?i) = In ^ 1 =p i —p i Xl (1.6) 

其中 p t = \nP t . 与简单净收益率凡相比，连续复合收益率有一些优点.首先， 
对多期收益率，我们有 

r t [*] = In (1+ \k]) = In |(1 + 佐） （1 + Rt-t)' • . (1 + 风 -*+ i )】 

=In (14* Rt) + In (1 + /2t_i) . • • + In (1 + fc+i) 

= r t + r t _i + … + n-/b 十 l . 

这样，连续复合多期收益率就是它所包含的连续复合单期收益率之和. 其次， 对数 
收益率具有更容易处理的统计性质. 

资产组合收益率 

若一个资产组合由 AT 个资产组成，则该资产组合的简单净收益率是它所包含 
的各个资产的简单净收益率的加权平均.其中每个资产所占的权重是该资产的价值 
占资产组合总价值的百分比.设 P 是^个资产组合，它在资产 i 上的权重为叫，那 
么 P 在 f 时刻的简申收益率= f ： 其中尺《是资产/的简单收益率. 

然而，资产组合的连续复合收没有上述方便的性质.如果简单收益率 
的绝对值都很小，则我们有 r p ， t « I ： wir it , 其中 r p .,. 是该组合在《时刻的连续复合 
收益率.这种近似经常被用来研究 i 1 产组合的收益率. 

分红支付 

如果一个资产周期性地支付分红，我们必须修改资产收益牟的定义.设认是 
一个资产在第 t - l 天和第 f 大之间的分红，巧是该资产在第 f 个周期末的价格. 

①可为小数. 译者注 
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这样，分红并没有包含在行中.因此 d 时刻简单净收益率和连续复合收益率分别 
变为 』 

Rt = f -1 ， re=ln(P, +A)-lnP,_i. 

尸 t-i 

超额收益率 

一个资产在 f 时刻的超额收益率是该资产的收益率与某个参考资产的收益率 
之差.这个参考资产通常是无风险的，如美国短期国债的收益率.简单超额收益率 
和对数超额收益率分别定义为 

Z t = R t - Rot, zt=r t — rot, (1-7) 

其中和 rt» 分别是该参考资产的简单收益率和对数收益举.在金融文献中，超 
额收益率被认为是某个套利投资组合的盈利.在这个投资组合中，对某资产持多头 
头寸而对参考资产持空头头寸，且初始投资净值为 0. 

注释：头金融头寸意味着持有某资产.空头头寸则指卖出不属于自己的资 
产. 这须通过从已购买该资产的投资者那里借入资产来完成.在之后的某天，卖空 
者有义务买进和借入完全相同數量的股份偿还给借出者•因为偿还时要求的是相 
等數量股份，而不是相等數量的美元，卖空者会由于该资产价格的下跌而获利.如 
果在空头持续期间该资产有现金分红，則支付给做空买卖的买者.卖空者也必须从 
自己的资源里配备相应的现金分红来补偿借出者.换句话说，卖空者有义务支出所 
借资产的现金分红给借出者. n 

关系小结 

简单收益串风与连续复合收益率 n 的关系是 

r* = ln(l -I- R t .) , Rt = e r, — 1. 

如果收益率印与 r t 是百分比，则 

r* = 1001n (1 + 盖 )， Rt = 100(e r * /lo ° - 1). 

收益率的时间累加使得 

1 + 佑 [ k }= (1 + 苽） （1 + ...(1 + R * fcu ), 

r t [fc] = r* 十 r t _i H - h r t -k+i- 

如果连续复合年利率为 r ， 则资产的现值与资产的未来价值之间的关系为 
A = C exp (r x n ) ， C = A exp (—r x n) 

例 1.1 若某项资产的月对数收益率为 4.46%, 则相应的月简单收益率为 10l%xp 

(4.46/100)-1]=4.56%. 同样，若某项资产在一个季度内的月对数收益举分别为 4.46%, 
-7.34%, 10.77%, 则该资产的季度对数收益率为 （ 4.46- 7.34+10.77)%=7.89%. 
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1.2 收益率的分布性质 


要研究资产收益率.最好从它们的分布性质开始.目的是要理解不同资产、不 
同时间收益率的表现.考虑 W 个资产，持有这 AT 个资产 T 个时间周期，如* = 
对每个资产 i ， 表示它在《时刻的对数收益率.所要研究的对数收益率 
为 = ,T }. 也可以考虑简单收益率 {7 ?^;t = l , ••- , N;t = 

1, ••- X ) 和对数超额收益率 {〜;*‘ = 1， …， ^彳=1， … t T }. 

1.2.1 统计分布及其矩的回顾 

我们简要地回顾一下统计分布的一些基本性质和随机变量的矩.设 R * 表示 
k - 维欧几里德空间， a : e 表示 * 是 R * 中的点，考虑两个随机向量 ； C = 
(不,…，為)'和 y = (》，••• y Y q y . 令 ppceAyeB ) 表示 X 在子空间 AcR * 
中且 y 在子空间 BCR ^ 中的概率.本书的大部分场合，都假定这两个随机向量 
是连续的. 

联合分布 
函数 


Fx,y (*, y\0) = P{X ^x.Y ^y\0), x g R p , j/ e R q 

是参数为 0 的 X 与 F 的联合分布，其中不等号是分量对分量的运算 . A ： 和 
Y 的规律由 F x<y ( x , y ;0) 刻画.如果 X 和 K 的联合概率密度函数 f x , v ( x , y - G ) 
存在，则 x y 

^x,y (*, y\0) = /i,„ (w, B) dzdw. 

J—OO J —— oo 

这时 . A ： 和 Y 是连续型随机向量. 

边际分布 
X 的边际分布是 


F x (sc; 0) = F Xy r (oj.cxj, •- ,oo；6>). 

这样 ，久 的边际分布可通过对 y 求积分得到.同理， y 的边际分布也可类似得到. 
如果 k = l , X 是一个一元随机变量.其分布函数为 

F x (x)^P(X ^x;0), 

称之为 A" 的累积分布函数 (Cumulative Distribution Function, CDF). —个随机变 
量的 CDF 是非降的 | 即对 a < x 2 有 F x (xO < F x (z 2 )], 且有 F x (-oo) = 0, 
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Fx ( oc ) = \. 对给定的概率使 p < Fx (巧）成立的最小实数&称为随机变量 X 
的 P 分位点.更具体地. 

x v - inf {a? |p < F x (x) }. 

本书中我们用 CDF 来计算检验统计量的 P 值. 

条件分布 


给定 Y < 1 / 的条件下 X 的条件分布为 

P{X ^x.Y ^y.0) 




若所对应的概率密度函数存在，则给定 Y = y 的条件下， X 的条件密度为 

r ，- 』、 fx t Ax ， y. ， e) ，… 

fx[v (x ' e) ~ fu(y ^) - ⑽ 

其中边际密度函数 f “ v ; 0 ) 由下式得到 

fv ( y ； 0 ) = [ /*,„ ( ar , y \ 0) dac . 

J — oo 

由 (1.8) 式知.联合分布、边际分布和条件分布之间的关系为 


fx,y I/' = fx\y (*i x fy {V- • (1.9) 

上述等式关系在时间序列分析中经常用到（如在进行最人似然估计时).最后, 
X 与 Y 是相互独立的随机向量当且仅当 / Ilw ( a :; 0) =仏 (*: 0)，这时 /： r, v (®, y ;») = 

fx{x\0) f v {y:0). 

随机变量的矩 

一个连续型随机变量 X 的 / 阶矩定义为 

mj = E ( X 1 ) = f x l f ( x ) dx , 

J— DO 

其中 “ E ” 表示期望 （ expectation ), /( ar ) 是 X 的概率密度函数.一阶矩称为 A ： 的 
均值 ( mean ) 或期望.它度量的是分布的中心位置，记为义的/阶中心矩定义为 

mi =E[^(X-^*) < ] = j (x - n x ) 1 f {x) 6x, 

假定上式中积分存在.二阶中心矩可度量 X 取值的变化程度. 称为 X 的方差 ( varia - 
nce ), 记为方差的正平方根仏称为； T 的标准差.一个正态分布由它的前两阶 
矩决定.对其他分布，可能要了解其更高阶矩. 
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三阶中心矩度量 X 关于其均值的对称性，而四阶中心矩度量 X 的尾部.在统 
计学中，标准化的三阶矩叫偏度 ( skewness ), 标准化的四阶矩叫峰度 ( kurtosis )， 它们 
分别用来描述随机变量的对称程度和尾部厚度.具体地， X 的偏度和峰度分别定义 
为 

K ( x ) = e \^-~^ x)4 . 

# J L 4 . 

量 /T (: r ) - 3 叫做超额峰度 (excess kurtosia ), 因为正态分布的峰度 K ( ar ) = 3 .这 
样.一个正态随机变量的超额峰度为 0. 若一个分布有正的超额峰度，则称此分布 
具有厚尾性，厚尾的含义是指该分布在其支撑 ( support ) 的尾部有比正态分布更多 
的“质量”.在实际中，这就意味着来自于这样一个分布的随机样本会有更多的极端 
值，故称这样的分布为尖峰的 ( lcptolmrtic ). 另一方面,一个具有负的超额峰度的分 
布是轻尾的（例如，有限区间上的均勻分布)，这样的分布称为低峰的. 

在应用中.我们可以用相应的样本偏度和样本峰度来估 U 偏度和峰度.设 
…，: c r } 是 x 的 r 个观察值.样本均值为 



Ax = 

1 i=i 

(1.10) 

样本方差为 

T * 



^ = T i 亡 (: t A *) 2 ， 

(1.11) 

样本偏度为 





(1.12) 

样本峰度为 




= l，x)i 

(1.13) 


在正态分布的假定下， S { x ) 和允 ( a :)- 3均渐近地服从均值为零、而方差分别为 6 /r 
和 24 /T 的正态分布[参见 Snedecor 和 Cochran (1980), 第78页].我们可以用这胜渐 
近性质来检验资产收益率是否具有正态性.给定一个资产收益率序列 { r l5 ... , r T }, 
要检验其偏度，即要考虑零假设: 0对备择假设: S ( r ) / 0.由 (1.12) 

式所定义的样本偏度的比统计量为 

卜姐 

师. 

决策规则 如下： 在显著性水平 a 下，若|«| > Z a /2 , 则拒绝零假设，其中 Z a/2 是标 
准正态分布的1⑻ ( a /2) 上分位点.另外一个方法是计算检验统计量 < 的 P 值，当 
且仅当 P 值小于 a 时拒绝 i / Q . 
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类似地，我们可以用假设检验丑 0 : K ( r ) - 3 = 0与 • K ( r ) -3^0, 来检验 
收益率序列的超额峰度.检验统计量为 

Mr )-3 

s/2AjT' 


并且该统计量渐近标准正态分布.决策规则为当且仅当检验统计量的 p 值小于显 
著性水平《时拒绝 Jarque 和 Bera (1987) 结合了这两个先验检验，并利用了下 


述统计量 


JB - 




( Mr ) - 3) 2 
24 /T * 


其中.该统计量的渐近分布是自由度为2的 x 2 分布.如果 JB 统计量的 P 值小于 
显著性水平则拒绝正态 性的队 假设. 

例 1.2 考虑表 1-2 中所用的 IBM 股票的日简单收益率.作为描述性统计量的一 
部分.收益率的样本偏度和峰度可以用各种统计软件包很容易地得到.我们给出了 
实例中用到的 SCA 和 S - Plus 命令，其中 ‘ d - ibmvwewsp 6203. txt ， 是数据文件名.需 
要注意的是，在 SCA 中峰度指的是超额峰度.输出结果中超额峰度很高，表明 TRM 
股票的 F 1 简单收益率具有厚尾性为了检验收益率分布的对称性，我们用检验统计 


量 


0.077 5 
0.024 


= 3.23, 


该检验统计量的 p 值大约为 0.001, 表明在5%的显著性水平下, IBM 股票的日简单 
收益率显著地右偏. 


表 1-2 几种股指和股栗日或月简单收益率和对数收益率的描述性统计霣 n 


fiE 券 

起始 U 期 

样本慑 

均值 

标准差 

偏度 

超额峰度 

最小值 

域大值 

SP 

62/7/3 

10446 

口简单收益率 （％) 
0.033 0.945 

-0.95 

25.76 

-20.47 

9.10 

VW 

62/7/3 

10446 

0.045 

0.794 

-0.76 

18.32 

-17.14 

8.66 

EW 

62/7/3 

10446 

0.085 

0.726 

-0.89 

13.42 

-10.39 

6.95 

IBM 

62/7/3 

1044(5 

0.052 

i.MS 

-U.U8 

1U.21 

-22.96 

13.16 



7828 




5.85 





10446 














-30.12 









-21,74 


■ 








































7.54 




JS330 § 




20.06 

30.08 







-0.73 

一 ■辦 ■ 

-35.83 
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(续) 


证券 

起始曰朗 

样本暈 

均值 

tS 准 M 

偏皮 

超额峰度 

最小值 

«大值 

Citi-Group 

86/10/30 

4333 

0.084 2.289 

月简单收益率（％) 

-0.21 

7.47 

-24.51 

18部 

SP 

62/1 

936 

0.64 

5.36 

-0.35 

9.26 

一 29,94 

42.22 

VW 

26/1 

936 

0.95 

5.49 

-0.18 

7.52 

-28.98 

38.27 

EW 

26/1 

936 

1.3 X 

7.49 

-1.54 

14.(54 

-31.18 

65.51 

IBM 

26/1 

936 

1.42 

7.11 

-0.27 

2.15 

—20.19 

35.38 

Intel 

73/1 

372 

2.71 

13.42 

-0.26 

2.43 

-44.87 

62.50 

3 M 

46/2 

695 

1.37 

6.53 

一 0.24 

0.96 

一 27.83 

26.80 

Microsoft 

86/4 

213 

3.37 

11.95 

-0.53 

1.40 

-34.35 

51.55 

Citi-Group 

86/11 

206 

2.20 

9.52 

-0.18 

0.87 

-34.48 

26.08 




月对数收益率（％) 





SP 

26/1 

936 

0.48 

5.62 

-0.50 

7.77 

一 35.58 

35.22 

VW 

26/1 

936 

0.79 

5.48 

一 0.54 

6.72 

一 34,22 

32.41 

EW 

26/1 

936 

1.04 

7.2 J 

0.29 

8,40 

-37.37 

60.38 

IBM 

26/1 

936 

1.16 

7.02 

-0.15 

2.04 

-30.37 

30 29 

Intel 

73/1 

372 

1.80 

13,37 

-0.60 

2.90 

一 59.64 

48.55 

3 M 

46/2 

695 

1.16 

6.43 

-0.06 

1.25 

一 32.61 

22.95 

Microsoft 

86/4 

213 

2.66 

11.48 

-0.01 

1*19 

-42.09 

41.58 

Citi-Group 

86/11 

206 

1.73 

9.55 

一 0.65 

2.08 

一 42.28 

23.18 


a 收益率是百分比，取样期截止到2003年12月31日.统计量分别由 (1.10) - (1.13) 式定义. VW , 
EW 和 SP 分别表示价值加权指数、等权 E 指数和标准普尔 （ S & P ) 复合指数. 

SCA 演示 

% 表示注释. 

input date, ibm f vw f ew, sp. file 1 d-ibmvwewsp6230.txt 1 
% Load data into SCA and name the columns date, 

•/• ibm, vw, ew, and sp. 


ibm=ibm*100 •/• Compute percentage returns 
desc ibm •/• Obtain descriptive statistics of ibm 


VARIABLE 
OF 
OF 


NUMBE 

NUMBE 


NAME IS 
OBSERVATIONS 
MISSING VALUES 


IBM 

10446 

0 


MEAN 

VARIAN 


CE 


STATISTIC 

0.0523 


2.7163 


STD. F.RR0R 
0.0161 


STATISTIC/S.E. 

3.2467 
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STD DEVIATION 

1.6481 


C.V. 

31.4900 


SKEWNESS 

0.0775 

0.0240 

KURT0STS 

10.2144 

0.0479 


QUARTILE 


MINIMUM 

-22.9630 


1ST QUARTILE 

•0.8380 


MEDIAN 

0.0000 


3RD QUARTILE 

MAXIMUM 

0.880G 

13.1640 



RANGK 

MAX - HTN 36.1270 

Q3 - Q1 1.7185 

S - Plua 演示 

> 为 DOS 提示符，％表示注释. 

> module(finmetric8) Load the Finmetrics module. 

> x«matrix(scan(file ss ， d-ibmvwewsp6203.txt , ), 5) % Load data 

> ibm:x[2,]*100 •/• compute percentage returns 

> summaryStats (ibm) •/• obtain summary statistics 

Sample Quantiles. 

min IQ median 3Q max 

-22.96 -0.838 0 0.8807 13.16 

Sample Moments : 

mean std skewness kurtosis 
0.05234 1.648 0.0775 13.22 

Number of Observations : 10446 

1.2.2 收益率的分布 

对数收益率 = = 的最一般的模型是它们的联合分 

布 函数： 

P'r (»*iir • - - ,r7vi ； ria, - - - ， tjv2; …; Tit, - - •itatt ； ^'0) , (114) 


其中 y 是由一些变量组成的状态向量.这些变量描述了决定资产收益率的环境 . 0 
是唯一决定分布函数 F r (•) 的参数向量.概率分布 • ㈠ 决定了收益率 u 和 y 的 
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随机行为.在许多金融研究中.把状态向量当作给定的，而主要关心的是给定 y 的 
条件下 {〜} 的条件 分布. 因此.资产收益率的实证分析是要估计未知参数 0， 并在 
给定一些过去的对数收益率的条件下对 { r it } 的行为做出统计推断. 

(1.14) 式的模型太广泛了，以至于失去了实际应用的价值.然而，它却提供了一 
个一般的框架，在此框架中，可以给资产收益率建立一个适当的计量经济模型 

有些金融理论，比如 Sharpe 在年提出的资本资产定价模型 (Capital Asset 
Pricing Model , 简记为 CAP \ i ), 考虑的是在单个时间点 f 上 AT 个收益率的联合分 
布（也即 { r u ，... nv t } 的分 布). 另外一些理论则强调 申个资 产收益率的动态结构 
(也即对一个给定的资产*•，的分布).本书对这两个方面都给予了充 
分的 讨论. 在第 2 〜 7 章的一元分析中，主要关心的是对资产 i ， 的联合分布. 
为此，把联合分布分解成如下形式 

F ( r «, •• - , r iT ; 9 ) = F ( m ) F ( r i 2 | r u ).• • F ( r < T ki . r - i , ••- , r u ) 

T 

=,m ). (1.15) 

e =2 

为简单起见,上式中略去了 0. 这个分解式突出了对数收益率〜在时间上的前后相 
依性.因此，主要的问题就是条件分布 F ( r it | r M _ l5 ) 的具体形式，特别是条件分布 
是怎样随时间演变的.在金融中，不同分布的具体形式会导出不同的理论.例如，随 
机游动假定的一种形式就是条件分布等于边际分布 F ( r it ). 
这时，收益率在时间上是相互独立的.从而是不可预测的. 

我们通常把资产收益率当作连续型随机变量对待.尤其是对低频的指数收益率 
或股票收益率.因此这里我们使用它们的概率密度函数.在这种情况下，利用等式 
(1.9)，我们把 (1.15) 式的分解写成 


/ ( r *i I • • • . nr\0) = /(r,i ； 0) Kt-i,-** ,r u ,0). (1.16) 

e=2 

对高频资产收益率，离散性就变成一个问题.例如，在纽约股票交易所 (New York 
Stock Exchange , 简记为 NYSE ), 股栗的价格是以个微小量 (tick size ) 的倍数变 
化的.这个微小量在 I" 7 年 7 月之前取为 I/ 8 美元，而在 1997 年 7 月至 2001 年 
1月是 1/1 6 美元.因此， NYSE 记录的个股的收益率不是连续 型的. 我们将在第5 
章讨论高频的股价变化和在价格发生变化之间的 則间持 续期. 

注释： 2000 年 8 月 28日， 纽约股票交易所开始了一项试验性的程序，对 7 
只 股票以十进制小数计价，而美国股票交易所 （American Stock Exchange , 简记为 
AMEX ) 开始对 6 只股票和两种期权种类以十进制小数计价.在 2000 年 9 月 25 日 
和 12 月 4 日， NYSE 分别增加了 57 只股票和 94 只股票进入该程序. 2001 年 i 月 
29 曰，所有在 NYSE 和 AMEX 交易的股票都以十进制进行交易. 口 
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(1.16) 式启示我们在资产收益率的研究中，条件分布比边际分布更有意义.然 
而,边际分布仍然需要关注，特别地.利用过去的收益率数据.估计边际分布比估计 
条件分布更容易.另外，有时通过实证看出资产收益率只有很弱的序列相关性，从 
而它们的边际分布与条件分布很相近 

在对资产收益率的边际分布进行研究的文献中，已经提到过几种分布，包括正 
态分布，对数正态分布、稳定分布和正态分布的尺度混合 (scale mixture ). 下面我 
们简要讨论一下这几种分布. 

正态分布 

金融研究中传统的假设是：简单收益率 {Rit = 是独立同分布的， 

均服从一个固定均值和方差的正态分布.这个假设使资产收益率的统计性质变得可 
以处理,但它遇到几个 困难： 第 一 ，简单资产收益率的下界为-1，而正态分布可以 
取到实数轴上的任何值，从而没有 下界; 第二.如果凡，是正态分布的，那么多期的 
简单收益率 ^ [ ik ] 就不再是正态分布的，因为它是单期收益率的 乘积； 第三，实证 
结果不支持正态性假设，很多资产收益率数据都具有正的超额峥度 

对教正态分布 

另一个常用的假 定是： 资产的对数收益率是独立同分布的且都服从均值为 p ,、 
方差为 a 2 的正态分布.那么在此假定下，简单收益率是独立同分布的对数正态分 
布的随机变量，均值和方差分别为 

E(/2 t ) = exp - 1， Var (R t ) = exp (2fi + a 2 ) [exp [a 2 ) - 1]. (1.17) 

上式在研究资产收益率时是有用的（如利用给对数收益率所建立的模型进行预测 
时).反之，假设简单收 益率柘 服从对数正态分布.均值为 rrn ， 方差为 m 2 . 则对应 
的对数收益率 n 的均值和方差分别为 



因为有限个独立同分布的正态随机变量之和仍服从正态分布，在的正态 
假定下 r t [ ik ] 也是正 态的. 另外， rv 没有下界，并且由 M 柘= cxp { r t } 知风的 
下界也能满足.然而，对数正态假定并不是与股票的历史收益率的所有性质都一致 
的.特別是很多股栗收益率表现出了正的超额峰度. 

稳定分布 

稳定分布是正态分布的自然推广，它们在加法运算下是稳定的，这一点符合连 
续复合收益率 r t 的要求.进一步讲，稳定分布能刻画股票的历史收益率所显示出 
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来的超额峰度.然而.非正态稳定分布没有有限方差，这一点与大部分金融理论相 
矛盾.另外.用非正态的稳定分布进行统计建模是很困难的.非正态稳定分布的一 
个例子是柯西 ( Cauchy ) 分布.其中关于它的中位数是对称的，但方差是无限的. 
正态分布的尺度混合 

对于股泉收益率的新近研究，倾向于利用正态分布的尺度混合或有限混合.在 
正态分布尺度混合的假定下,对数收益率 r , 服从均值为 / z 、 方差为 a 2 的正态分布 
(也即 r t 〜 N 但是，^是一个随机变量，它服从一个正的分布（如 a - 2 服 

从一个伽玛分布).正态分布的有限混合的一个例子是 

r t ^( X - X)N (/z, a 2 ,) -f XN (/i,, 

其中 X 是服从伯努利分布的随机变量，即 P{X = l ) = a , P(X = 0)=1 - ot , H 
0 < a < 1, a ? 较小而 4 相对较大.例如，对《 = 0.05, 有限混合指的是95%的收 
益率服从 7 NT (#，?)，5%的收益率服从 AT ⑺， 4). 的较大值使混合把更多的“质 
量”放在其分布的尾部.来自于 TV (^ al ) 的收 益率的 百分比较低，表明大多数收益 
率服从一个简单的正态分布.正态分布有限混合的优点 包括： 保持了正态分布的易 
处理性、具有有限高阶矩和能刻画超额峰度.然而.我们很难估计混合参数（如有 
限混合中的 a ). 

图1-〗显示的是正态分布的有限混合、柯西分布和标准正态分布的概率密度 
函数. 正态分布的有限混合是 (1- X )^(0,1) + X 7 V (0, I 6), 其屮 X 为满足 H{X = 
i ) =0.05 的伯努利随机变置.柯西密度函数是 

/(3；) 、(lW °° <a?<00 * 

可见，柯西分布有比正态分布的有限混合更厚的尾部，而正态分布的有限混合有比 
标准正态分布更厚的尾部. 



图 1-1 正态分布的有限混合、稳定分布和标准正态分布的密度函数的比较 
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1 . 2.3 多元收益率 

设 r t = (nw ^奶)'是 yv 个资产在 t 时刻的对数收益率.第8章和第9章 
的多元分析将涉及 { n > r =1 的联合分布.这个联合分布可以用与 (1.15) 式相同的方 
式来分解.因此分析集中条件分布 F(n ••- , r t ,0) 的具体形式上.特别地， 

r , 的条件期望和条件协方差阵怎样随时间演变是第8章和第9章讨论的主题. 

随机向量 X … ， X p ) 的均值向量和协方差矩阵定义为 

E ( Jf )= Ma; = [ E ( A - 1 ) 1 ... 1 E ( X p )] / , 

Cov(X) = S x = E[(X-/i x )(X- 

假定 A ： 所涉及到的期望是存在的.当有米自于 A 的数据样本 
均值和样本协方差阵定义为 

1 r . 1 T 

它 * = _ AJ (*! - /O' ‘ 

i=l t=l 

假定 x 的协力差矩阵存在.则这些样本统计量都是它们对应的理论值的相合估计. 
在金融文献中，多元止态分布常用来描述对数收益率 TV 

1 . 2.4 收益率的似然函数 

(1.15) 式的分解可用来得到一^资产的对数收益率 { n ,-.- , r T } 的似然函数•这 
里为了符号上的简便，对数收益率中的下角标 t _ 省略不写.若条件分布 
ruO ) 是均值 为叫、 方差为矸的正态分布，则0由参数糾和 < 组成，数据的似然 
函数为 

t r 2 - 

/ (n, • * • , rr ； 0 ) = / (n; 0 )[[ exp - 卜 ， ( 1 . 18 ) 

其中 /( r ,;0) 是第一个观测 n 的边际密度函数，使似然函数达到最大值的0的值 
就是参数0的最大似然估计 （ MLE ). 因为对数函数是单调的， MLE 可通过最大化 
如下对数似然函数得到： 

lxi /( n , ••- , r T ；0) = ln /( ri ；0) - | 匕 (2 n ) + to (< rf ) 4 - . 


对数似然函数在实际中更容易处理一些.若条件分布不是正 
态的.则数据的对数似然函数可用类似的方式得到. 
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图 1-2 IBM 股票从1926年1月到1997年12月的月收益率的时间图, 
上方的图是简单收益率，下方的图是对数收益率 


1 . 2.5 收益率的经验性质 

本节所用数据是从芝加哥大学证券价格研究中心 ( CRSP ) 得到的.如果有分 
红支付，则它也包含在收益率之中了.图 1-2 显示的是 IBM 公司股票从1926年 
1月到1997年12月的月简单收益率和对数收益率的时间图 (time plot ). 时间图 
显示的是对应于时间的数据.上方的图表示简单收益率.图 1-3 显示的是价值加权 
( value - weighted ) 市场指数的月简单收益率和对数收益率的时间图.如所期望的一 
样，这些图表明简单收益率和对数收益率的基本模式相似. 


| I I I 

1040 1960 1980 2000 

年 

m 1-3 价值加权市场指数从1926年1月到2003年12月的月收益率的时间图. 
上方的图是简单收益率，下方的图是对数收益率 
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表 1-2 列出了所选的美国股票市场指数和个股的简单收益率和对数收益率的 
一些描述性统计量的值.所列收益率是日收益率和月收益率.它们的值以百分比给 
出.所用数据的时间跨度和样本容量大小也在表中给出.从这个表中我们观察到如 
下几点 ： （ a ) 市场指数和个股的 R 收益率具有很高的超额峥度，而对月收益半序列， 
市场指数的月收益率的超额峰度比个股的月收益宇的超额峰度高出 许多； （ b ) 日收 
益率的均值接近于零，而月收益率的均值要稍大 一些； （ c ) 月收益率比日收益率有 
更大的标 准差； （ d ) 在日收益率中，市场指数的标准差比个股的标准差小，这一点与 
通常的感觉是相 符的； （ e ) 偏度不是一个严重问题，对日收益率和月收益率都是如 
此； ⑴ 描述性统计量表明简单收益率和对数收益率的差别很小. 

图 I - 4 显示的是 IBM 股票的月简单收益率和对数收益率的经验密度函数.在 
每个图中，虚线是由表 1-2 中的 IBM 收益率的样本均值和样本标准差决定的正态 
概率密度函数.图像表明对 IBM 股票的月收益率作正态性假定是值得尚榷的.经 
验密度函数与对应的正态分布密度函数相比,在均值附近有更高的峰.但尾部更厚. 
换句话说.与正态密度相比,经验密度函数更高、更瘦，但有更宽的支撑. 




阁 1-4 IBM 股票的月简申收益率和月对数收益率的经验密度函数和正志密度函数的比较.取 
样闩期仍然是 1926 年 1 月到 2003 年 I 2 月. 左边的图是关于月简单收益率的，右边 
的图是关于对数收益率的.虚线给出的 TF 态密度由表 1-2 中给出的样本均值和样本标 
准差决定 
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除了收益率序列以外，我们还考虑波动率过程和资产极值收益率的行为.波动 
率过程研究的是收益率的条件方差随时间演变的规律.这是一个有趣的问题.因为 
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如图 1-2 和图 1-3 所示的那样.收益率变化的大小随时间变化且呈现出聚类现象. 
在应用中，波动率在期权定价和风险管理中起重要作用.收益率序列的极值指的是 
绝对值火的正或负的收益率.表 1-2 说明收益率序列的最大值和最小值是不可忽视 
的.负的极值收益率在风险管理中很重要，而正的极值收益率对持有空头头寸是至 
关重要的.我们将在第7章中研究极值收益率的性质和应用，例如极值发牛的频 
率、极倌的大小和经济变量对极值的影响等. 

本书考虑的其&金融时间序列包括利率、汇率、债券收益率、公司每股的季度 
贏利.图 1-5 所示的是美国两种月利率的时间图，分别 是/从 1954年4月至2004年 
3月间的10年期和1年期具有固定期限的国库券利率.正如我们所期望的，这两 
种利率的变化基本同步，但1年期利率的波动程度要更大一些.图 1- G 给出了 2000 
年1月到2004年3月间的美元对日元的日汇率时间图.从图中可以看出，在取样 
期间，外汇遇到了偶尔发生的大变化.表 1-3 给出了一些美国金融时间序列的描述 
性统 II 量的值，其中从 CRSP 得到的偾券的月收益率是 Fama 债券组合的收益率， 
时间是从1952年1月到 20 U 3 年12月.利率数据是从圣.路易斯联邦储备银行 
(Federal Reserve Bank of St . Louis ) 得到的， 3 个月国库券的周利率从1954年1月 
8日开始，6个月国厍券的周利率则从1958年12月12日幵始.这两个序列的截止 
曰期都是2004年4月9日.对利率序列而言，期限越长，样本均值越大，而样本标 
准差越小.对债券收益率序列而言，样本标准差与期限长度正相关,而样本均值对 
所有期限保持稳定.这里所考虑的大部分序列具有正的超额峰度. 



阁 1-5 1954 年 4 月到 2004 年 3 月美国的月利韦的时间图 ： （ a) 10 年期固定期限国库券利 

( b ) 1年期固定期限国库券利率 






a 败据的值是百分比 . 3 个月期国库券的周利率起始时间是1954年1月8曰，6个月国库券起始时问 
为1958年12月12日，正文中已给出了数据来源. 

关于表 1-2 所示的收益率的经验特征.第2 〜 4章的内容涉及收益率序列的前 
四阶矩•第7章讨论收益率最小值和最大值的行为，而第8章和第〗0章研究多个 
资产收益率的矩及它们之间的关系.第5章讨论当时间区间很小时资产收益率的 
性质.第 (5 章介绍了数理金融的基本内容. 
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练习题 

1.1 考虑如下公司股票从1994年1月到2003年12月的日收益率 ： American Express ( axp ), 
Caterpillar ( cat ) 和 Starbucks ( sbux ). 文件 d -3 stock . txt ( date , axp , cat , sbux ) 给 
出 r 简单收益率数据 

(a) 将简单收益率用百分比表示出来.计算简单收益率百分比的样本均值、样本标准差、 
样本偏皮、样木超额峰度.最小值和最大值. 

( b ) 把简单收益率转换成对数收 益率. 

( c ) 将对数收益率用百分比表示出来.计算日对数收益率百分比的样本均值，样本标准 
差、样本偏度、样本超额峰度.最小值和最大值. 

( d ) 对每只股票的对数收益率进行零均值检朌（进行三次独立的检验).对数收益率的样 
本均值是显著地不同于零吗？在5%的显著性水平下得出你的结论. 

1.2 考虑从1975年1月到2003年12月间的 IBM 股票、 CRSP 价值加权指数 （ VW)、CRSF 
等权重指数 ( EW ) 和标准普尔综合指数的月收益率，重新回答练习题 1.1 的所有问题.指 
数收益率已包含分红.数据文件是 m - ibm 3 dx 7503. txt . 

1.3 考虑练习题 1.2 中从1975年1月到2003年12月的标准普尔复合指数的月收益率.回 
答下述 问题： 

(a) 在数据取样期间内，平均年对数收益率是多少？ 

( b ) 假定没有交易费用.如果某人于1975年初在标准普尔综合指数上投资1美兀，那么 
到2003年底该投资的价值是多少？ 

1.4 考虑练习题 1.1 中从1994年1月到2003年12月间的 American Express ( axp ) 股票 
的曰收益率.在5%的显著性水平下进行下述检验. 

( a ) 检验收益率的偏度为零的零假设是否成立 ■ 

( b ) 检验收益率的超额峰度为零的零假设是否成立. 

1.5 可在芝加哥的联邦储备银行得到每天的外汇汇率数据是由纽约的联邦储备银行认证的纽 
约市场上的中午买入价.考虑从2000年1月到 2(104 年3月间的加拿大元、欧元、英镑 
和日元对美元的汇率. 

(a) 计算每种汇率序列的日对数收益率. 

( b ) 计算每种汇率对数收益率序列的样本均值、样本标准差、样本偏度，样本超额峰度、 
最小值和最大值. 

( c ) 讨论这些汇率的对数收益率序列的经验特征. 

参考文献 
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第 2 章线性时间序列分析及其应用 

本章讨论线件时间序列分析的基本理论，介绍一些对分析佥融时间序列有用的 
简单计量经济模型，并将这些模型应用于资产收益率.我们重点讨论了与金融应用 
有关的概念.理解本章所介绍的简单时间序列模型对掌握以后各章中更复杂、更深 
入的金融计量模型是必要而有益的.我们已有许多时间序列的教科书可供参考.对 
线性时间序列分析的基本概念，可参见 Bux，Jenkins 和 Reinsel (1994) 的第 2 章和 
第 3 章.以及 Brockwell 和 Davis (1996) 的第 1 〜 3 章. 

把资产收益率（如股票的对数收益率 rf ) 看成随时间推移而形成的一族随机 
变量. 我们就有了一个时间序列 { rt }. 线性时间序列分析提供了一个自然的框架， 
来研究这种序列的动态结构 • 本书所讨论的线性时间序列的理论包括平稳性、动 
态相依性、自相关函数、建模和 预测. 另外，本书所介绍的经济计量模型包括： （a ) 
简单自回归 ( AR ) 模型； （ b ) 简单滑动平均 ( MA ) 模型； （ c ) 混合的自回归滑动平均 
( ARMA ) 模型； （ d ) 季节 模型； （ e ) 单位根非平 稳性； （ f ) 带时间序列误差的回归模 
( g ) 刻画长相依性的分数阶差分模型.对资产收益率 r< ， 试图用简单模型来刻 
画 D 与《时刻之前所拥有的信息之间的线性关系.这里的信息可以包括 r , 的历史 
值和 （1.14 ) 式中的 y , 这个 y 是描述决定资产价格的经济环境的.同样地：相关 
系数 ( correlation ) 在理解这些模型中起着重要作用.特别地，所研究的变量与其过 
去值的相关系数成为线性时间序列分析的 焦点. 这匙相关系数称为序列相关系数 
(serial correlation) 或自相关系数 

(autocorrelation), 它们是研究平稳时间序列 

的基本工具. 


2.1 平稳性 

平稳性是时间序列分析的 基础. 时间序列 {rt} 称为严平稳的 (strictly sta¬ 
tionary), 如果对所有的《，任意正整数和任意 A : 个正整数⑷，…， k )， ^， ... ， 
r tfc ) 的联合分布与 ， rtfc+t ) 的联合分布是相 问的. 换 言之， 严平稳&要^ 
(%，… , r tk ) 的联合分布在 B 、 j 间的平移变换下保持小变.这是一个很强的条件，难 
以用经验方法验证，经常假定的是平稳性的一个较弱的形式.时间序列称为 
弱平稳的 (weakly stationary), 如果的均值与 r< 和的协方差不随时间而 
^变，其中 Z 是任意 整数. 更具体地说， { r < } 是弱平稳的，若⑷ Er , 是一个 

常数； （ b) Cov (r f ,r t _/) = 7 /, 7 / 只依赖于 [ 在实际中，假定我们有 r 个数据观测点 
= !,••• , T }, 弱平稳性意味着数据的时间图显示出 T 个值在一个常数水平上 
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下以相同幅度波动.在应用中，弱平稳性使我们可以对未来观测进行 推断. 即预测 • 
在弱平稳性的条件中，我们隐含地假定了 n 的前两阶矩是有限的 • 由定义可 
见，若 7 V 是严平稳的且它的前两阶矩是有限的.则^也是弱平稳的.反之，一般是 
不成立的.但如果时间序列是正态分布的.则弱平稳性与严平稳性是等价的.本 
书主要考虑弱平稳序列. 

协方差71 = Cov(r t ,r t ,) 称为 n 的间 隔为/ 的自协方差 • 它具有两个重要 
性质： (a)7o = Var(r t ); ( b )7 i = 7i 第二个性质成立是因为 Cov (r»,r t _(_j))= 
Cov (r t _(_/),r t ) — Cov(r t+ j,r t ) ^ Cov(r tl ,r tl _i), 其中 h = 

在佥融文献中，通常假定资产收益率序列是弱平稳的.只要有足够多的历史收 
益率数据.这个假定可以用实证方法验证.例如，我们可以把数据分成若干子样本， 
然后检验它们的一致性. 

2.2 相关系数和自相关函数 

两个随机变量 x 和 r 的相犬系数定义为 

Cov ( X , r ) E [{ X - n x ){ Y -^ y )} 

Px ， v — N / Var ( X ) Var ( y ) - -^ X ) 2 E(K - ^ 2, 

其中 ~ 和心分别表示 义和 V 的均值，并且假定方差是存 在的. 这个系数度量的 
是 A ■和 y 线性相关的程度，可以证明一1 彡 彡1且 P ； r, V =办,*•若 Par.y = 0, 
则这两个随机变量是不相关的.另外，若 x 和 y 都是正态随机变量，则= 0 
当且仅当和 y 是相互独立的.当我们有样本 {(^, y t )}Li 相关系数可以由 
它对应的样本相关系数相合地估计出来： 

p = ( x t — {yt — y) 

PX ' V ~ 

其中无= l T ^ v = ( ej / i ) / t 分别是 x 和 y 的样本均值. 

自相关函数 （Autocorrelation Fuucliou , ACF ) 


考虑弱平稳收益率序列~当我们考虑 r t 与它的过去值 7* t _, 的线性相依关系 
时.可以把相关系数的概念推广到自相关系数 . r t 与 rp 的相关系数称为的间 
隔为 f 的自相关系数.通常 记为外 在弱平稳性的假定下它只是/的 函数. 具体地说, 


定义 


Cov (r t ,rt-f) _ Cov(r t ,rt -() = 卫 
y^Var (n) Vai (re-/) Var (r t ) 70, 


( 2 . 1 ) 


这里用到了弱平稳序列的性质 Var ( r <) = Var ( r t _ ( ). 由定义，我们有仲 = h Pi = 
p _, 和 - 1 < < 1. 另外，一个弱平稳序列是序列不相关的当且仅当对所有丨> U 
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都有 Pi = 0. 

对一个给定的收益率样本 { Wf =1 ，设 f 是样本均值，也即 r = ( f ： r j /：/，，则 
r t 的间隔为 1 的样本自相关系数为 W， 


h 


r ) ( n-1 - f ) 


ELi(r t -f) S 


在某些一般性条件下 ，仏是 Pl 的相合 估计. 例如，若 { rt } 是独立同分布 （ iid ) 序列 
且 E ( rf ) < oo , 则仏 渐近地服从均值为0、方差为 l / r 的正态分布（见 Brockw^ll 
和 Davis (1991) 的定理 7.2.2). 在实际中，这个结果可用来检验原假设 ff 0 ： Pl ^ o 
和备择假设: p! ^ 0. 检验统计量就是通常的《比，即 v/Tp,, 它渐近地服从标 
准正态 分布. 一般地， r , 的间隔为/的样本自相关系数定义为 




( 2 . 2 ) 


若 { r t } 是一个独立同分布序列，满足 E ( rf ) < 00 ,则对任意固定的正整数/,命渐 


近地服从均值$ 0、方差为 1/ r 的止态 分布. 史一般地，若 rt 是一个弱平稳序列. 
满足 r t = fj .+ f ； tpiat - i , 其中 ip 0 = l , q 为非负整数.{^}是高斯白噪声序列，则对 


l> ^ Pi 渐近地服从均值为0、方差为^1 + 2 |：/)?^ / T 的正态 分布. 在时间序列 
的文献中，称此结果为 Bartlett 公式（参见 Box , Jenkins 和 Reinsel (1994)). 关于样 
本自相关函数的渐近分布的更多信息，参见 Fuller (1976) 的第6章和 Brockwell 和 
Davis (1991) 的第7章. 

检验单个 ACF 


对一个给定的正整数可用前面的结果来检验 H 0 :内= 0和 f/ a :内# 0.检 
验统计量为 

t-ratio = 〆 

V( 1 +2Et 1 1 p?)/T 

卞果 { r t } 是一个平稳高斯序列并且满足当 _?• > /时巧= 0,则该 t - 比渐近地服从 
标准 TR 态分布 • 决策规则是：当卜比 | > Z „ /2 时拒绝馬，其中 Z a/2 是标准正态分 
布的 100(1- a /2) 分位点. 

对有限样本，命是内的有偏 估计. 偏差的阶是 i / r ， 这在样本容量 r 较小时是 
不容忽视的.但在大多数金融应用中， r 相对较大，故这个偏差并不严重. 

混成检验 （Portmanteau Test ) 

金融应用中常需要检验 rt 的几个自相关系数是否同时为零 . Box 和 Pierce 




24 第 2 章线性时间序列分析及其应用 


(1970) 提出了 “混成”检验统计量 

771 

Q * (爪)=了5^汾 
/=1 

来检验原假设 ffo ■ Pi = • • ' = Pm = 0和备择假设并 a :对某 i e {1，… ， m } ， Pi ¥ Q . 
在 { r ,} 为满足一定矩条件的独立同分布序列的假定下， Q * ( m ) 渐近地服从自由度 
为 m 的 x 2 分布. 

Ljung 和 Box (1078) 为了提高有限样本时检验的功效把统计量 Q * ( m ) 修改为 

m wj 

Q { w )= T ( T -{- 2 ) Y l YZ- r (2.3) 

(=1 

决策规则 是：当 Q ( m ) > xl 时拒绝 仇， 其中是自由度为 m 的 x 2 分布的 
10 U (1 - a ) 分位点.大部分软件包都会给出 Q ( m ) 的 p 值.决策规则 是：当 p 值小 
于等于显著性水平 a 时拒绝 i / 0 . 

在实际中， m 的选择会影响 Q { m ) 的表现.常用到几个 m 值. 模拟研究表明， 
取 m « In (了）会有较好的功效.在分析季节性时间序列时，这个一般性的规则需要 
修正，因为此时间隔为季节性周期的倍数的自相关系数是很重要的. 

由 （2.2) 式定义的函数 心' … 称为 r t 的样本自相关函数 （ ACF ). 这个函数 
在线性时间序列分析中起着重要作用.事实上，一个线性时间序列模型可完全由其 
ACF 决定，并且线性时间序列的建模用样本 ACF 来刻画数据的线性动态关系.图 
2-1 所示的是 IBM 股票从1926年1月至1997年12月间的月简单收益率和对数 
收益率的样本自相关函数.这两个样本自相关函数非常接近.都表明即便 IBM 股 
票收益率有序列相关性，其相关性也很小.两个样本 ACF 的值均在两个标准差之 
内，说明在5%水平下它们与零没有显著差别.此外，对于简单收益率， T 小 mg-Rmc 
统计量为 Q (5) = 5.4, Q (10) - 14.1, 对应的 p 值分别为 0.37 和 0.17( 基于自由度 
为5和10的 X 2 分布).对子对数收益率， Q (5) = 5.8, Q (10) = 13.7, p 值分别为 
().33 和 0.19. 这就证实了 ffiM 股票收益率没有显著的序列相关性.图 2-2 所示的 
是价值加权指数（该数据来0芝加岢大学的 CRSP ) 的月收益率的两个同样的函数， 
在5%水平下这两个收益率序列都存在某些显著的序列相关性.对于简单收益率， 
Ljung-Box 统计量为 Q (5) = 27.8, Q (10) = 36.0; 而对于对数收益率， Q (5) = 26.9, 
g (10) = 32.7 .这4个检验统计量的 p 值都小于 U .000 3,表明价值加权指数的月收 
益率是序列相关的.因此，市场指数的月收益率要比个股的月收益率有更强的序列 
相关性. 

在金融文献中，资本资产定价模型 ( CAPM ) 理论的一种形式就是假定资产收 
益率序列 { r * t } 是不可预测的，且没有自相关性.零自相关系数的检验被用来作为有 
效市场假定是否成立的判定工具.然而，股价的决定方式和指数收益率的计算方式 
可能会导致在观察到的收益率序列中有自相关性.尤其是在分析高频金融数据时. 
第5章将讨论此方面的问题. 
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⑷简申收益率 



图 2 -1 IBM 股票从1926年1月到1的7年12月间的月简单收益率和月对数收益率的样本 
自相关 函数. 每个图中的两条横线表示样本自相关函数的两个标准差的上下限 


0»)简单收益準 



间隔 

图 2-2 美国股栗市场价值加权柑数从 11)26 年1月到1997年12月 N 的月简单收益率和月 
对数收益率的样本自相关 函数. 毎个图中的两条横线表不样本自相关函数的两个标 
准差的上下限 


SCA 演示 

给出了输出结果，％表示注释. 

input ibm. file *m-ibm2697.txt* % Load data 
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acf ibm. maxi 10. % Compute 10 lags of ACF. 


NAME OF THE SERIES. IBM 

TIME PERIOD ANALYZED.1 TO 864 

MEAN OF THE (DIFFERENCED) SERIES • . • 0.0142 

STANDARD DEVIATION OF THE SERIES . . • 0.0670 

T-VALUE OF MEAN (AGAINST ZERO) .... 6.2246 


AUTOCORRELATIONS % ACF(lag 1 to 10), Standard error, Q(m) 


1-10 

.07 

.01 

-.02 

-•01 -.01 -.01 

-,00 

.07 

.05 

.04 

ST.E. 

.03 

.03 

.03 

.03 . 

03 .03 

.UJ 

.03 

.03 

.03 

Q 

4.8 

4.9 

5.4 

5.4 5 

.4 5.5 

5.5 

10.2 

12.6 

14.1 


p=l-cdfc(5.4,5) % Calculate p-value 

print p % Print p-value 

.369 


S-Plus 演示 

给出了输出结果， > 表示 DOS 提示符. 

> ibm=scan(file**m-ibm2697.) % Load data 

> autocorTest(ibm # lag=5) % Perform Q(5) test 

Test for Autocorrelation ： Ljung-Box 

Null Hypothesis : no autocorrelation 

Test Statistics ： 

Test Stat 5.4474 
p.value 0.3638 

Dist• under Null : chi-square with 5 degrees of freedom 
Total Observ .； 864 

> ibm=log(ibm+1) % Convert into log returns 

> autocorTest(ibm # lag=5) 

Test Statistics s 

Test Stat 5.7731 
p.value 0.3289 

Dist. under Null: chi-square with 5 degrees of freedom 

2.3 白噪声和线性时间序列 

白噪声 

时间序列 {./•«} 称为一个白噪声序列，如果 { TV } 是一个具有有限均值和有限方 
差的独立同分布随机变量序列.特别地，若 n 还服从均值为0、方差为( X 2 的正态 
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分布，则称这个序列为高斯白噪声.对白噪声序列，所有自相关函数为零.在实际应 
用中， 如果所有样本自相关函数接近子零,则认为该序列是白噪声序列.基 T 图 2-1 
和图 2 - 2 , IBM 股票的月收益率接近白噪声，而价值加权指数的收益率不是白噪声. 

价值加权指数收益率的样本自相关系数的性质启示我们在对一些资产收益率 
进行更深入的分析之前,有必要对其序列相关性进行 建模. 下面我们讨论一些简单 
的时间序列模型，它们对时间序列的动态结构的建模非常有用，而且所述的思想在 
以后给资产收益的波动率建模时也是很有用的. 

线性时间序列 

时间序列 { r t } 称为线性序列，如果它能写成 

OQ 

r * = P + XI 柄 - i ， (2.4) 

其中 // 是 r t 的均值.咖=1, { a < } 是零均值独立同分布（假定 at 的分布是合理定 
义的）的随机变量序列（也即 {〜} 是白噪声序列).我们在以后可以看出，叫表示 
时间序列在 f 时刻出现了新的信息，因此 常将叫 称为时刻 f 的新息 ( innovation ) 或 
扰动 ( shock ). 本书中我们主要关心的是 a < 为连续型随机变量的 情形. 然而并不是 
所有金融时间序列都是线性的.第4章将研究非线件件和非线性模型. 

在（ 2 . 4 )式定义的线性时间序列中，系数仇决定了 rt 的动态结构，在吋间序 
列文献中这些系数称为 r , 的也-权重若 r * 是弱平稳的，我们利用 { at } 的独立性 
可以很容易得到 r t 的均值和方差 


E ( r t ) = / i , Var ( r t ) = (2.5) 

t (=0 

其中4是 a t 的方差.因为 Var ⑹< + 00 ,所以{喊}必须是收敛序列 ，即当 
i — oo 时 0 t ? — 0_相应地，随着 i 的增大，远处的扰动山一对 rt 的影响会逐渐消 
失 . 

r t 的间 隔为/ 的自协方差为 


7 t = Cov ( r ,, r t - i ) = E 


(SH (: 


E I Mjat-iOt-i-j 






i=o 

OO 

4 H 桃 •+<• 


(2-6) 
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因此，士权重与 n 的自相关系数有如下 关系： 

Pl j &她十, 


Z^O, 


(2.7) 


70 

其中咖= 1. 线性时间序列模型就是用来推述 r t 的 ，权重的量经济模型和统 
计模型.对弱平稳序列而言，当 i -» oo 时趴 — 0,从而随着 f 的增加仍收敛到 0. 
对于资产收益率而言，这意味着，如问所期望的那样 ，当/ 较大时，当前收益率 r t 刈 
遥远过去的收益率 r t _ w 的线性依赖会消失. 


2.4 简单的自回归模型 


crsp 价值加权指数的月收益率 n 具有统计显著的间隔为 i 的自相关系数. 
这个事实说明延迟的收益率在预测 r t 时 nj •能会有用.利用这样的预测功用的 
一个简单模型是 

rt =加 + <t>irt-i + at, (2.8) 

其中 { a ,} 是均值为0、方差为4的白噪声序列.这个模型与众所周知的简单线性 
回归模型有相同的形式，这里 r , 是因变量 . 是自变量.在时间序列的文献中. 
模型 (2.6) 称为一阶 自冋归 ( AR ) 模型，或简称 AR (1) 模型.该模型也广泛地应用 
在随机波动率的建模中，只不过那时 r t 由它的对数波动率所代替，见第3章和第 
12 章. 

(2.8) 式中的 AR(1) 模型有若千类似于简单线性回归模型的性质.但是，这两 
个模型之间存在一些显著的差异，这一点我们将在以后讨论.这里我们需要注意到 
这样个事 实：由 AR(1) 模型可推得，在己知过 i 收益率的条件下， 

E(r t |r t _i ) = <^o 4- Var(r t |n_i) = Vax(o t ) =<rj. 

也就是说，给定过去的收益字现在的收益韦将以 00 + ^ iri -! 为中心取值，标 
准差是 a a . 给定 n — 条件下， r t 与 r t _ 4 (t > 1) 无关，这是 AR ⑴的马尔可夫性. 
当然，有些情况下不能单独决定 n 的条件期望.此时需要更复杂一些的模型. 
AR (1) 模型的直接推广是 AR ( p ) 模型： 

+ •.. + 0 p rt- p + a t ， (2.9) 

其中 P 是非负整数. {〜} 的定义跟 （2.8) 式中一样.这个模型 表示： 给定过去的数 
据时，过去的 P 个值= 1, . p ) 联合决定 r t 的条件期望. AR ( p ) 模型与以 p 
个延迟值作为自变量的多元线性回归有相同形式. 

2.4.1 AR 模型的性质 


为了有效地利用 AR 模型，有必要对它的基本性质进行研究.我们详细地讨论 
AR (1) 模型和 AR (2) 模型的性质，对一般的 AR ( p ) 模型本节只给出其 结果. 
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AR ⑴樸型 

我们首先讨论 (2.8) 式定义的 AR (1) 模型的弱平稳性的充分必要条件.假定序 
列是弱平稳的，则 E ⑹=//， Var ( r t )=7 o , Cov ( r t , r t _,) = 7j , 其中 / i , 7u 是常数, 
是 J 的函数而与 t 无关. 我们容易得到序列的均值、方差和自相关系数.对 （2.8) 
式两边取期望，因为 E (叫） = 0,所以 

E ( r t ) =知 + 分 iE ( r t _!). 

在平稳性的条件下，从而 

二如 + <pin 或 E ( r t ) = n = . 

1-01 

这个结果有两个 含义： 第一，若也 〆 1,则 r , 的均值 存在； 第二， r t 的均值为0 2 
且仅当如= 0. 闵此，对平稳 AR (1) 过程，常数项如与 r < 的均值有关，如= 0意 
味着 E ( r t ) - 0. 

我们利用如= (1 咖 可以把 AR ⑴模型写成如下形式 

r t -n = <l> l (rt_! - /i) + a t , (2.10) 

重复代入，由上述方程可推得 

Tt ~ H = dt "I - + (j^CLt-2 + •. * 

= (211) 
i =0 

因此， r t - p 是 a t _,, * > 0 的线性函数.利用这个性质和 { at } 的独立性，我们有 
E [(/7 - //) a t+1 j = 0. 由平稳性的 假定， 我们有 Cov ( r t _ x , a t )=E [( r t _! -/ i ) a t J = 0. 
此性质可从直观上看出来，因为 rt —, 发生在 < 时刻之前而 at 不依赖于任何过去的 
信息•对 （2.10) 两边平方，然后取期望得到 

Var ( r £ ) =必 f Var ( r *_ i ) + o\ y 

其中4是 A 的方差,这里我们用到 “ rty 与叫的协方差为零”这样一个事实.而 
在平稳性的假定下, Var ( r () = Var ( rt _ i ), 故 

V 吨 卜為， 

上式在的< 1时 成立. 因为方差是非负有限的，故要求辦 < 】.这样，由 AR (1) 模 
型的弱平稳性可推得 -1 < < 1. 反之，若- 1 < 也< 1,由 (2.11) 式和序列 { at } 

的独立性，我们可以证明 r , 的均值和方差是有限的，参见 （2.5) 式.另外，由 （2.6) 
式， n 的自协方差也是有限的.从而， AR (1) 模型是弱平稳的.综上所述， （2.8) 式定 
义的 AR (1) 槙型是弱平稳的充分必要条件是 | 和 | < 1 . 
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AR (1) 模型的自相关函数 

在 (2.10) 式两端乘以 o *， 再取期望，利用 o * 与 n — 的独立性，我们有 
E [ a t ( r t -n)] = E [a t ( r t _i - / i )] + E ( o ?) = E ( a *) = g 2 „. 


其中 4 是〜的方差.对 (2.10) 式两端同乘以 ( rt - i - fi ), 取期望，再利用上述结果， 


我们有 



泠 1 T 1 + 


当/ - 0时， 
当 i > 0时， 


这里利用了 7-<=7»这个性质.因此，对 (2.8) 式定义的弱平稳 AR (1) 模型，有 


由后一方程，的自相关函数 ( ACF ) 满足 


Pi = I > 0 . 

因 po — 1， 故有内这个性质表明弱平稳 AR(1) 序列的自相关函数从如 一 1 
开始以比率为扣的指数速度衰减.对正的和， AR(1) 模型的自相关函数 （ACF) 图 
像呈现漂亮的指数衰减.对负的和， AR(1) 模型的 ACF 由上下两个都以的比率 
指数衰减的图像组成.图 2-3 所示的 是当扣 = 0.8 和如= - 0.8 时的 AR ⑴模型 
的 ACF 图. 
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AR(2) 模型 
AR(2) 模型形如 

rt = 00 -I- 0ir t _i + <h.Tt-2 + at- (2.12) 

利用与 AR(1) 情形相同的方法，我们 得到： 只要如+扣/ 1，就有 

E (r t ) =/* = -~ :。 . 

1—01—02 

利用 <h = i }-< t > i -< h )^ 我们可把 AR(2) 模型改写成 

r t - n =( f>i (r t _i - p )-\-< f>2 ( r t -2 - a *) + a t . 

在上式两端同乘以 r t q - /!，我们有 

( r t-i ~ ( r i - A*) — 0i - (r t -i —/i) + ^2 (ft-i A 4 ) (^t -2 -〆)+ (r t _j — fi) at, 
再取期望，并利用当 f > 0 时 E[(r t _, -n)at]=0 这个性质，我们得到 
11 = + 027 i -2, I > 0. 

这个结果称为平稳 AR(2) 模型的矩方程，在上式两端冋除以70,得到 n 的 ACF 的 
性质 ： 

Pi = < Pipi -\ 4- < hPi - 2 , I > 0. (2.13) 

特别地，间隔为1的 ACF 满足 

Pi = <P\Po + <hp-\ = 0i + <hPi. 

因此，对平稳的 AR(2) 序列 r t ， 我们有 


Po = l t 



Pi = <kpl-l + 02P/-2, I > 2. 

(2.13) 式的结果说 的是： 平稳 AH(2) 序列的 ACF 满足二阶差分方程 

(1 — <f>iD — <h 0 2 ) pi = 0 , 

其中 B 是向后推移算子，即 Bp, =/>,_!. 这个差分方程决定了平稳 AR(2) 序列的 
ACF 的性质，也决定了 r< 的预测行为.在时间序列的文献中，有时也用 L 而不是 
B 来表示向后推移算子.这里 L 表示延迟算子，如 Lr t = r t _ u L 如一 h 
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与前面的差分方程相对应的是二次多项式方程 

1-<I>iX-4>2£ 2 =0- (2.14) 

这个力程的解是 ( _ 

扣丄十40 2 
- 2(^2 

在时间序列文献中，称这两个解的倒数为 AR (2) 模型的特征根.用 A 和0； 2 表示这 
两个解.如果两个以都是实值,则模型的二次差分方程能分解成 ( I - aSMI - 
的形式，这时 AR (2) 模型可以看成两个 AR .(1) 模型的叠加，即一个 AR (1) 模型满 
足另一个 AR (1) 模型.因此，这时的 ACF 是两个指数衮减的混合.然而，如果 
的+4也 < 0,则 a 和都是复数（称为复共轭对)，这时 r , 的 ACF 将圼现出减 
幅的正弦和余弦波的图像.在商业和经济的应用中，复特征根很重要，它们会导致 
商业环的出现.对经济时间序列模型来说，复值特征根也很常见.对由 (2.12) 式定 
义的，带一对共轭复特征根的 AR (2) 模型.随机环的平均长度为 

, = _ 2 jc _ 

cos- 1 [ 彡 " (2V-<^)] ’ 

其中反余弦函数的值以弧度表示.如果我们将复数解写成 a ±6 i 的形式，其中 
i = v /= T , 则我们有如= 2 a , 扣= -( a 2 + 6 2 ), 并且 

“ 2n 

cos~ 1 (a/y/a 2 + 6 s ) 5 


其中是 a 土 W 的模. 

图 2-4 显示的是四个平稳 AK (2) 模型的 ACF . ( b ) 图是 AR (2) 模型 （1 - 0.6 B 
+ OAB 2 ) n =叫的 ACF . 因为封 + 4扣= 0.36 + 4 x (-0.4) = -1.24 < 0,故这个 
AR (2) 模型包含两个复特征根，从而它的 ACF 呈现出减幅的正弦和余弦波状.其 
他三个 AR (2) 模型都是有实特征根的，它们的 ACF 呈指数衰减. 

例 2.1 作为说明，考虑美国的实际国民总产值 ( GNP ) 的季度增长率.我们已经 
作了季节调整.时间从1947年第二个季度到1991年第一个季度.图 2-5 给出了这 
个时间序列的时间图，并且该序列在第4章中将作为一个非线性经济时间序列的 
例子.这里我们简单地用 AR (3) 模型来分析这组数据.用表示增长率，我们可 
以用 2.4.2 节的建模方法来估计这个模型.拟合的模型是 

r t = 0.004 7 + 0.35 re_i 4- 0.18 r t 一 2 - 0.14 r t _ 3 + a t , a a = 0.009 8. (2.15) 

把上述模型改写成 

rt — 0.35 r t _i - 0.18 n— 2 + 0.14 r «_3 = 0.004 7 + at, 




我们得到对应的三阶差分方程 
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1 - 0.355 — 0.18 B 2 + 0.14 S 3 = 0, 


它可以分解成 

(1 +0.52 J 5) (1 - 0.87 B + 0.27 B 2 ) = 0. 


第一个因子 (1 + 0.52 B ) 表明所考虑的 GNP 增长率有指数衰减的特征.对第二个 
因子 1 - 0.87 B - (-0.27) B 2 = 0,有搿 + 4扣= 0.87 2 + 4 (-0.27) = -0.323 1 < 0. 
因此，这个 AR (3) 模型的第二个因子说明美国的实际 GNP 的季度增长率中存在随 
机商 业环. 这一点是合理的，因为美国经济经历了膨胀和紧缩期.随机环的平均长 
度大约为 


2(3.14159) 
cos -1 [(f>i / (2彳-必 2 )] 


= 10.83 (季度）， 



这大约为3 年. 若用一个非线性模型去把美国经济分解成“膨胀期”和“紧缩期” 
的话. 数据将表明紧缩期平均长度大约为3个季度，而膨胀期的平均长度为3年 
(见第4章中的分 析). 10.83 个季度是这两个平均长度的折中.这里得到的周期性 
在国民经济增长率的研究中是常见的，例如许多 OECD 国家也存在类似上面所述 
的现象. 
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图 2-5 从 1947 年第二个季度到 1991 年第一个季度美国的实际国民总产值 
增氏率的时间围.数据按季节调整并以百分比 il 数 

平稳性 

AR .(2) 时间序列的平稳性条件是它的两个特征根的模都小于 1. 在这个条件 
下.递推式 (2.13) 保证模型的自相关函数随间隔/的增加而趋于 U . 这个趋于 0 的 
性质是一个时间序列平稳的必要条件.事实上，这个条件也适用于 AR (1) 模型，这 
时特征多项式是 1 - = 0, 特征根为 w = 1/z =也，要使 n 是平稳的，必 须有呶 
的模小于 1. 而前面已证明过.对平稳 AR (1) 模型有 W =私，这隐含着当 Z — oo 
时，有饵 — . 0 . 

AR ( p ) 模型 

AR (1) 模型和 AR (2) 模型的结果可以推广到由 （2.9) 式定义的 AR { p ) 模型.对 
平稳的 AR ( p ) 序列，其均值为 


假定分母不等于 0. 模型对应的多项式方程为 

1 — 4>lX — <j>2X 2 - <f) p X P = 0, 

称之为该 AR ( p ) 模型的特征方程.如果这个方程的所有解的模都大于1，则序列 
{ r t } 是平稳的.同样，解的倒数为该模型的特征根.因此，平稳性要求所有特征根的 
模都小于 1. 对于平稳 AR ( p ) 序列而吉，其自相关函数满足方程 

[l — < j >\ B — 02 H 2 — • • • — ( f ) p B p ) pi = 0, / > 0. 

自相关函数的图像呈现出减嗝的止弦、余弦和指数衰减的混合状，具体形状取决于 
其特征根的性质. 
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2.4.2 实际中怎样识别 AR 模型 

在丈际应用中，一个 AR 序列的阶 P 是未知的，必须裉据实际数据来决定.求 
解阶 P 的问题叫做 AR 模型的定阶.在时间序列文献中这个问题已被广泛研究 
过.一般有两个决定 p 的 方法： 第一种方法是利用偏相关函数 (PACF, Partial Auto 
CorrelaLiou Fuuctiou); 第二种方法是用某个信息准则函数. 

偏自相关函數 

平稳时间序列的 PACF 是它的 ACF 的一个函数,它在给 AR 模型定阶时是一 
个有用的工具.一个简单而有效的引进 PACF 的方式是考虑如下一连串的 AR 模 
型： 

r» = U <t>i,irt-i + eif, 

r* = <f>n,7 4- + <t>7.7rt-7 + eat, 

Tt = <6o. 3 + 4 - 02,3r»_2 + 4>3,3rt-3 + e3t, 

rt = 0o,4 + + 02,4^-2 4 - (h,4U-3 4 - 4 - eu, 


其中， 00, j 是常数项, <5^ 是 r t _ f : 的系数, W 是 AR 0) 模型的误差项.这些模型都 
是多元线性回归的形式，可用最小二乘法来估计.事实上，由于它们是按阶的高低 
排列的，故我们可以应用多元线性回归分析中偏 F 检验的思想.第一个式子中的估 
计称为 TV 的间隔为1的样本偏自相关 函数; 第二个式子中的估计&， 2 称为 r t 
的间隔为2的样本偏自相关 函数: 第三个式子中的估计&, 3 称为 n 的间隔为3的 
样本偏自相关函数:依此类推. 

从定义可以看出，间隔为2的样本偏自相关函数&. 2 所表示的 是：在 AR (1) 
模型 r * 二 0 n + 0 m-i + ew 基础上添加的 n _ 2 对 r # 的贡献;<^ 3 , 3 表示的是在 AR (2) 
模型上添加的 n _ 3 对的 n 贡献; 如此等等.因此，对一个 AR ( p ) 模型，间隔为 P 的 
样本偏自相关函数不应为零，而对所有 j > P , 应接近于零，我们利用这一性质 
来决定阶 P . 对于平稳高斯 AR ( p ) 模型，可以证明其样本偏自相关函数 （ PACF ) 有 
如下 性质： 

• 当样本容量 r 趋于无穷时， ‘, p 收敛于 

• 对 I > p , 心 收敛丁•零； 

• 对 I > p ， 蚤1，1 的渐近方差为 

这些结果表明， AR ( p ) 序列的样本偏自相关函数是 p 步截尾的. 

作为例子，考虑从1926年1月到1997年12月的 CRSP 价值加权指数月简单 
收益率.表 2-1 给出了这个序列的样本自相关函数在前10个间隔上的值. T =864, 
该样本偏自相关函数的渐近标准差大约为 0.03. 从而，在5%的显著水平下，我们 
给数据识别一个 AR (3) 模型或 AR (5) 模型（也就是 p =3 或 5). 
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表 孓1 

从 1 9 26 年 1 月到 1997 年 12 月的 CRSP 价值加权指数月 
简单收益率的样本 PACF 和 AIC 


P 1 2 3 4 5 

PACF 

AIC 

0.11 

-5.807 

-0.02 

一 5.805 

一 0.12 

一 5.817 

0.04 

一 5.816 

0,07 

-5.819 

hhishi^hih 



8 

9 

10 

PACF 

-0.06 

0.02 

0.06 

0.06 

-0.01 

AIC 

一 5.821 

一 5.819 

—5.820 

-5.821 

-S.A1R 


作为另外一个例子，图 2-6 给出了例 2.1 中 GNP 增长率的 PACF . 图中的虚线 
表示的是大约为两个标准误差的上下限土(2/\/1^).此图表明 AR (3) 模型适合该 
数据，因为样本 PACF 在前三个间隔点上比较大. 



图 2-6 从1947年第2季度到1991年第1季度的美国实际 GNP 季度增长率的 
样本偏自相关系数.虚线给出了置信水平为95%的置信区间的近似 
信息准则 

有几种信息准则可用来决定 AR 过程的阶 p ， 它们都基于似然函数.例如，著 
名的 Akaikc 信息准则 (AIC)(Akaike, 1973) 定义 如下： 

A / C = 似然函数的最大值)+善 (参 数的个 数)， (2.16) 

其中 r 是样本容量.对高斯 AR(l) 模型， AIC 简化为 

AIC(l) = \n(af)^ t 

其中 5 f 是4的最大似然估计，4是 a t 的方差， r 是样本容量（见 （1.18) 式). 
(2.16) 式中的 AIC 的第一项度量的是 AR(l) 模型对数据的拟合优度，而第二项称 
为准则中的惩罚函数，因为它用参数的个数来惩罚所用的模型.不同的惩罚函数导 
致了不同的信息准则. 
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另外一个常用的信息准则函数为 ( Schwarz ) 贝叶斯信息准则 ( BIC ). 对高斯 
AR ( l ) 模型，该准则为 

BIC (0= In ( 衫 ）+ ^1 

对每个参数的惩罚在 AIC 中为2,而在 BIC 中为 bi ( T ). 因此，当样本容量适度或 
较大时， BIC 倾向于选择一个低阶的 AR 模型. 


选择规则 


在实际应用中，为了利用 AIC 来选择一个 AR 模型，要计算 AIC ⑴，对 1=0,1, 
2,- P , 其中 P 为事先给定的一个正整数，然后选择阶 A ;， 使 AIC 达最小值. 

表 2-1 也给出了 p = l ,2,- • • ，10时 AIC 的值.这些 AIC 的值都很靠近，当 p = 6 
和 P = 9时达最小值-5.821，故按准则应选 AR (6) 模型.这个例子说明不同的方 
法可能会得出阶 P 的不同选择.在实际应用中，还没有证据表明一种方法就一定比 
另外一种方法好.对给定的时间序列数据选择一个 AR 模型时，还有两种因素起着 
重要作用，即所研究问题的具体信息和模型的简单性. 

再次考虑例 2.1 中美国季度实际 GNP 增长率序列， S-Plus 中 Finmetrics 模块 
给出的 AIC 识别了一个 AR (3) 模型.这里，准则倌已经经过调整以使得 AIC 的最 
小值为0_ 

> gnp=scan(file= , q-gnp4791.txt*) 

> ord*ar(gnp) 

> ord$aic 


【 1 】 

27.569 

2 . 608 

1.590 

0.000 

0.273 

2.203 

[7] 

4.017 

5.992 

5.826 

7.523 

7.822 

9.581 

[13] 

7.398 

8.943 

10,912 

12.895 

14.298 

16,279 

[19] 

18.100 

20,050 

22 • 007 

23.436 

25.378 



> ord$order 
tl] 3 

参数估计 


对 f 由 （2.9) 式给出的一个具体的 AR ( p ) 模型,我们常用条件最小二乘法来估 
计其参数.条件最小二乘是从第 p +1 个观测值开始的.具体地说，在给定前 P 个观 
测值的前提下，我们有 

rt = (po+ H - 1- 0 p r t _ p 4-ot, t = p + 1 ， … ， 2 ’， 

上式为多元线性回归的形式,其中的参数可用最小二乘法估计. 记么为 也的估计, 
所拟合的模型为 

= 00 •+* 4 -+ ^>pTt-p 


对应的残差为 


at = T t -r f . 
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称{^}为残差序列，并得到 

-2 _ 

a _ T - 2 p - 1' 

如果用条件最大似然方法，和的估计保持不变，而$的估计变力 5 F 2 =5 2 X(T _ 
2 p - l )/( T - p ). 作为说明，考虑给表 2 -1 所示的价值加权指数的月简单收益率建立 
一个 AR (3) 模型，所拟合的模型为 

r t = 0.010 3 I 0.104 r t _| — O.OlOrt 一 2 — 0.120 rt — 3 + o a = 0*054. 

系数的标准误差依次分别是 0.002, 0.034, 0.034 和 0.034. 除了延迟为2的系数外， 
其他参数在1%的水平下都是显著的. 

对这个例子，所建 AR 模型的系数都很小，表明所考虑序列的序列相关性较弱， 
即使这种相关性在1%水平下是统计显 著的. 所拟合的模型中 ▲ 的显著性意味着 
这个序列的期望平均收益率是正的.事实上, / i =0.010 3/(1-0.104+0.010+0.120)=0.01 
是一个很小的正数，但它有重要的长期意义.这意味着所考虑的指数的长期收益率 
是相当大的.利用第1章中定义的多周期简单收益率，这时平均年度简单毛收益率 
是十 « t )] l2/864 - 1 « 0.105 3. 换句话说，从 1926年到 1997年间 ， CRSP 价 
值加权指数的月收益大约平均每年增长10.53%.此数据支持这样一个 观点： 长期 
来看，股票市场的表现令人乐观•在1926年初1美元的投资，到1997年底的价值 
大约1350美元. 

模型的检验 

我们必须仔细地检査所拟合的模型以防止可能存在的模型的非充 分性. 如果 
模型是充分的，则其残差序列应是白 噪声. 残差的样本自相关函数和 （2.3) 式定 
义的 Ljung - Box 统计量可用来检验与一个白噪声的接近程度.对 AR ( p ) 模型， 
Ljung - Box 统计量 Q ( m ) 渐近服从自由度为 m - »的欠 2 分布，其中是所用模型 
中 AR 系数的 个数. 这里对自由度进行了修正，是因为从拟合 AR (0) 模型到拟合 
AK ( j >) 模型，对残差心的限制个数增加了.如果所拟合的模型经验证是不充分的， 
那么就需要对它进打重新 改进. 例如，如果某些被估 AR 系数与0没有显著差别， 
则我们应该去掉这些不显著的参数，以此对模型进行简化.如果残差显示出额外的 
序列相关性，则应考虑到这些相关系数而对模型进行扩展. 

现在考虑对价值加权指数的月简单收益率拟合 AR (3) 模型所得的残差序列 • 
可算得 g (12)=16.9, 并且基于自由度为9的 X 2 分布的值为 0.05. 这样，在5% 
的水平下，前12个间隔无序列相关性的原假设几乎不能拒绝.然而，延迟为2的 
AR . 系数在5%的水平下是不显著的，我们可以将模型改进为 


n = 0.010 2 + 0.103 r f _i - 0.122 r f _ 3 -f a t , & a = 0.054 2, 
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其中所有的估计在5%的水平下都是显著的残差序列给出 Q (12)=17.2, 其值为 
0.070( 基子分布).该模型对数据的动态线性依赖性的建模是充分的. 

SCA 演示 


给出了输出结果. 

input vw. file *m-vw2697.txt* 

tsm ml. model (1,2,3)vw=c+noise. % Model specification 
estim ml. hold resi(rl). 

SUMMARY FOR UNIVARIATE TIME SERIES MODEL Ml 


VARIABLE TYPE OF ORIGINAL DIFFERENCING 

VARIABLE OR CENTERED 

VW RANDOM ORIGINAL NONE 


PAR. VAR. NUM./ FACTOR ORDER CONS- VALUE STD T 

LABEL NAME DENOM. TRAINT ERROR VALUE 

NONE .0103 .0019 5.34 

NONE .1041 .0338 3.08 

NONE -.0103 .0340 -.30 

NONE -.1204 .0338 -3.56 

EFFECTIVE NUMBER OF OBSERVATIONS . . 861 


R-SQUARE. 0.025 

RESIDUAL STANDARD ERROR. 0.541903E-01 


acf rl. maxi 12. 


3 VW AR 12 

4 VW AR 13 


NAME OF THE SERIES. Rl 

TIME PERIOD ANALYZED.4 TO 864 

MEAN OF THE (DIFFERENCED) SERIES • . • 0.0000 

STANDARD DEVIATION OF THE SERIES . . . 0.0542 

T-VALOE OF MEAN (AGAINST ZERO) .... 0.0000 


AUTOCORRELATIONS 


1- 12 .01 .01 - .01 .03 .09 -.05 .01 .04 .08 -.00 -.03 .01 

ST.E. .03 .03 .03 .03 .03 .03 .03 .03 .03 .03 .03 .03 

Q .0 .1 .2 1.0 7.4 9.3 9.3 10.6 15.8 15.8 16.8 16.9 


p=l-cdfc(16.9,9) % Compute p value. 
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S-Plus 演示 

给出了输出结果，> 表示 DOS 提示符. 

> vw=scan(file= r m-vw2697.txt # ) 

> ar3=OLS (vw-ar (3)) 

> summary (ar3) 

Call ； 

0LS{formula = vw - ar (3)) 

Residuals : 

Min IQ Median 3Q Max 

-0.2845 -0.0259 0.0025 0.0208 0^3705 



Value SLd, Error t value Pr(>|t|) 
(Intercept) 0.0103 0.0019 5.3314 0.0000 

lagl 0.1041 0.0339 3.0716 0.0022 

lag2 -0.0103 0.0341 -0.3016 0.7630 

lag3 -0.1204 0.0339 3.5538 0,0004 



R-Squared 0.0258 
Adjusted R-Squared 0.0224 
Durbin-Watson Stat 1.9890 

> autocorTest(ar3$residuals,lag=12> 

Test for Autocorrelation : Ljung-Box 
Null Hypothesis ： no autocorrelation 
Tftst Statistics : 

Test Stat 16.9367 

p - value 0»1520 % 3-Plus uses 12 degrees o£ freedom. 

> 1-pchisq(16.9367,9) % Calculate p-value using 9 df. 

U] 0.04971652 


2.4.3 拟合优度 

衡量平稳模型拟合优度的一个常用的统计量是 i ? 2 统计量,其定义为 

残差的平方和 
~ 总的平方和 - 

对于平稳 AR ( p ) 模型，假设有 r 个观测 { r t |t = 1,…， r }， 则/ I 2 交为 


i? 2 = l- 


St= P +i 

E^ P+ i(r t -f) 2 
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其中 f f f ； rj / { T - p ). 容易证明，0 $ R 2 $ 1. 特别地， R 2 越人，表示模型 

\*==r*fi / 

对数据拟合地越好，然而该结论只对平稳时间序列成立.对于本章后面将要讨论的 
单位根非平稳序列，当样本容量趋于无穷时，无论 n 实际服从一个怎样的模型.对 
其拟合一个 AR ⑴模型时，/? 2 均趋于 1. 

众所周知，对于一个给定的数据集 . 是所用参数个数的非降函数.为了克服 
该缺点，建议用调整后的炉，它定义为 

„ 2 ,残差的方差 

Adj - W = 1 - 

r t 的方差 

其中#是 n 的样本方差.这个新的衡量方法将拟合模型中用到的参数个数也考 
虑在内.然而，其取值仍然在0和1之间. 

2.4.4 预测 

预测是时间序列分析中的一个重要应用.对 (2.9) 式中的 AR { p ) 序列，假定我 
们在时间指标为 />. 的点上欲预测 r h+l , I ^1. 时间指标 h 称为预测原点 (forecast 
origin ), 正整数 f 称为预测步长 （forecast horizon ). 设心⑴为 n + i 的最小均方误 
差预测 ，凡 为在预测原点 h 所得到的信息集合.则我们选 择心⑴ 作为预测，使得 
4⑴满足 

E{[r hH - _】 2 |^K nunE[(r h+t - g) 2 lF h J t 

9 

其中是 A 时刻（包括"时刻）所得到的信息的函数，即 y 是的函数.我们称 
f k ( i ) 为 n 的以/ I 为预测原点的向前 f 步预测. 

向前1步预測 
由 AR { p ) 模型，我们有 

rh+i =如 + …+ ipprh + i-p + a/,+i • 

在均方损欠函数下，给定^ = 的点预测为条件期望 

P 

i=l 

对应的预测误差为 

6 h ( l ) = rh + i - th ( l ) = afc + 1 . 

从而，向前1步预测误差的方差为 Var [ e h ( l )] = Var (如 +1 ) = 4 .若免 服从正态分 
布，则的95%的向前1步区间预测是4⑴± 1.96 x < r a . 对 (2.4) 式给出的 
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线性模型，也是以 t 为预测原点的向前〗步预测误差.在计量经济的文献中， 
〜十1称为*十1时刻序列的扰动. 

在实际应用中，经常用被估参数来计算点预测和区间 预测. 这导致了条件预测. 
因为这样的预测没有考虑参数估计中的不确定性.理论上，我们可以在预测中考虑 
参数的不确定性，但其复杂性将大大增加.当在估计中使用的样本容量充分大时， 
条件预测与无条件预测是接近的. 

向前2步预測 

下面考虑以/ I 为预测原点对 r h +2 的预测.由 AH ( p ) 模型，我们有 
= 4 - 4* * •• + <t>prh+2—p 4 - a " 十 2 . 

取条件期望，我们有 

r^(2) = E(rh 十 2| 八）一如 + 0ir/»(l) + + . *. + <p p rh+2-j> 

对应的预测误差为 

e "(2) = rh +2 — r *(2) = 0 i [ r^+i — fft ( l )] 4- = a / 1+2 + 

预测误差的方差为 Var [ e /,(2)] = (1 +巧 X r/l+2 的区问预测可以用与相同 
的方法计算 出来. 值得注意的是 Var [ c ft (2)| > Var [ e h ( l )], 这意味着预测步长的增加 
会使预测中的不确定性也 增加. 这与通常的感觉是一 致的： 对线性序列来说.我们 
在/ I 时刻对 r h + 2 的把握不如对 r h + 1 的把握大. 

向前多步预測 
一般地,我们有 

r h^-t = 00 + 01 Hi 十 £-1 + • • • + (f> p rk-\-i^p + 

基于均方损失函数最小化而得到的向前/步预测就是给 定八. 的条件下的条 
件期望，可以由下式得到 

P 

尹 h+t — ^0 + 0 ， 

i=l 

其中，当 i <0时，约定 r h { i ) = 这个预测可用 r h ( i),i = 1，2,… , 1 - 1 递推计算 
出来•向前/步预测的误差是一 - f h ( l ). 可以 证明： 对平稳 AR ( p ) 序列， 
当 Z ，+ oo 时， f h ( l ) 收敛于 E { r t ). 也就是说，对这样的序列.长期的点预测趋于 
无条件均值 ■ 在金融文献中，这种性质称为均值回转 (mean reversion ). AR (1) 模型. 
均值回转的速度由半衰期 （ half - life ) 来衡量，其中半衰期定义为 A : = 10(0.5/1^1), 预 
测误差的方差则趋于 r t 的无条件方差. 
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表 2-2 包含了对价值加权指数月简单收益率的向前1步至6步的预测结果和 
相应的预测误差的标准 差：以 858为预测原点，利用前858个观察值重新估计的 
AR (3) 模型.实际的收益率也已给出.由于序列的弱自相关性，预测值和预测误差 
的标准差将很快收敛到样本均值和数据的标准差.前858个观察值的样木均值和 
标准差分別为 0.009 8和 0.055 0. 


表2~2对 CRSP 价值加权指数月简单收益率用 AR(3) 模型的 
向前多步预测的结果，预测原点为858 

步败 1 2 3 4 5 6~ 

预测值 0.008 8 D.002 0 0.005 0 0.009 7 0.010 9 0.010 6 

标准误差 0.054 2 0.054 6 0.054 6 0.056 0 0.055 0 0.055 0 

实环值 0.076 2 - D .036 5 0.058 0 -0.034 1 0.031 1 0.01 H 3 


图 2-7 所示的是对价值加权指数月对数收益率的超出样本范围之外的向前1 
步至6步的预测值和它们的两个标准差的上下限.这些预测是由下述 AR (5) 模型 
给出的： 


r t = 0.007 5 + 0.103r t _i +- 0.002r t _ 2 - 0.114r t _ 3 十 0.032r t — 4 + 0.084r t _ 5 + a t , 


其中 d a = 0.054, 该模型是由前面所讨论的建模程序建立的.在这个例于中，预测 
值很接近实际值.所有实际值都在95%的预测区 fBj 内. 



图2~7 CRSP 价值加权指数月对数收益率的向前1步至6步的预测图预测原点为«=858, 
预测值用空心点“ •”表示，实际值用实点“ . ”表示.两条虚线表示预测值的两个标 
准误差的上下限 


2.5 简单滑动平均模型 


本节将讨论另一类简单模型，它们在金融收益率建模中也很有用.这类模型叫 
做滑动平均模型 （ moving - average , MA ). 引进 MA 模型有几种方式：一种方式是把 
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它当作白噪声序列的简单 推广； 另一种方式是把它看成参数受某种限制的无穷阶 
AR 模型. 本节采用第二种方式.如在第5章将要讨论的，在股票交易中.买卖价格 
间的跳动会在收益率序列中引出一个 MA ⑴结构. 

除了简单性之外，没有特别的理由假定 AR 模型的阶是有 限的. 我们可以考虑 
(至少在理论上）无穷阶 AR 模型为 

H = 00 + 沴 in— 1 + <f>2 r t—2 4* • • • + at. 

然而，这样的 AR 模型是没有实际意义的，因为它有无穷多个参数.使这样的模型 
有实际用途的一个方式是假定系数0,满足某种限制，使得它们可由有限个参数决 
定.这种想 法的个 特殊情形力 

n = 00 - 0\Tt-x -沒? TV 2 - B\r t 3 - + a t , (2.17) 

其中系数只依赖于单个参数(^，0, = - > 1.要使 (2.17) 中的模型是平稳的,^ 
必须是绝对值小于1的，否则巧和序列本身将发散.因为|心| < 1,故当 i — oo 时， 
有 W — 0 . 从而•对 rt 的贡献随/的增加以指数速度衰减.这一点是合理的. 
因为平稳序列 r t 对它的延迟值如果有依赖的话,这种依赖程度应随时间衰减. 
(2.17) 中的模型能写成一个相当紧凑的形式.为此.我们把模型先写成 

U -^0\ Tt -\ + 0 \ r t -2 + ••- = Oq + a t . (2.18) 

对 n 1的模型为 

r t-i + 0 xr t -2 4- 0 fr t —3 + ... =如 + at - i ， (2.19) 

在 (2.19) 式两边乘以的，然后减去 (2.18) 式，得到 

r t = ^»o(l - 9i) + a t - tfiot-i, 

此式说明：除去常数项外， r t 是两个扰动 at 和 at-i 的加权 平均. 因此，此模型称 
为1阶 MA 模型，简称为 MA ⑴ 模型. MA ⑴模型的一般形式为 

rt = Co + at — 0 ia t -i 或 rt = co 4- (1 — 6\ D ) a t , (2.20) 

其中 cn 是一个常数， { a ,} 是一个白噪声序列.类似地， MA (2) 模型的形式为 

n = C0 + Of - Oidt-I - 02Ot-2, (2.21) 

MA ⑷模型为 

rt = co 十 — Oiat-i -- 6 q a t - q , (2.22) 

或 = cq + (1 — - OgB ^ at , 其中 q >0. 




2.5.1 MA 模型的性质 


2.5 简单滑动平均樸型 45 


我们仍然只讨论简申的 MA (1) 和 MA (2) 模型. MA ⑷模型的结果可用相同 
的方法得到. 

平稳性 

MA 模型总是弱平稳的，因为它们是白噪声序列的有限线性组合，其前两阶矩是不 
随时间变化的.例如，考虑 (2.20) 式给出的 MA (1) 模型.对这个模型两端取期望可 
得 E ^ n ) = 这不随时间变化.在 (2.20) 式两端取方差，我们有 

Var ( n ) = = (1 + e \) crl ， 

这里我们用到与的不相关性. Var ( r t ) 也不随时间 变化. 这些讨论对一般 
的 MA ( 9 ) 模型也适用.因此我们得到两个一般 性质： 第一， MA 模型的常数项就是 
序列的均值[也即 E ( r t ) = co ]; 第二， MA ⑷模型的方差为 

Var ( rt ) = (l + ^+^+〜 + %X 

自相关函数 

为简单起见，假定 MA (1) 模型中 co = 0. 对两端乘以 r t _,, 我们有 

Tt-iTt = ft-tat — 0ir t -ta t -\. 


驭期望，得到 

71 =-设 i <^， 且 Z > 1 时1 7t = 0 
利用上述 结果. 并注意到 Var ( r t ) = (1 + 6^1 ，我们有 




PI = 0, 


其中 1>1. 


因此，对 MA ⑴模型，间隔为 1 的 ACF 不为 0, 但所有间隔大于 1 的 ACF 都是 0. 
换言之， MA(1) 模型的 ACF 在间隔为 1 以后是截尾的•对 (2.21) 式给出的 MA(2) 
模型，自相关系数是 


-e l + e x e 2 _ -(h 

pl= 1+矜 +痄’ P2 = TTW + W * 


pi = 0 , 其中 l > 2. 


这时，在 阆隔为 2 以后截尾.这个性质可推广到其他 MA 模型.对 MA( 9 ) 模型，其 
ACF 在 闻隔为 g 时不为 0, 但对 l > q , p t = 0. 因此， MA ⑷序列只与其前 (/ 个延 
迟值线性相关，从而它是一个“有限记忆”的模型- 
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可逆性 

将零均值 MA (1) 模塑改写为 a t = r t +9 x a t . u 重复迭代可以得到 
= r t + Oxn-x + 0 2 x r t -2 + 的 n 一 3 … . 

该等式表明当前的扰动叫是现在和过去收益率序列的线性组合.从直观上看，随 
着 j 的增加朽应该趋于零，因为遥远的过去收益率对当前的扰动应该几乎没有影 
响. 因此，要使 MA ⑴模型看起来是合理的，我们应该 要求队| < 1. 这样的 MA (1) 
模型称为可逆的•如果|仏| = ：1•则 MA (1) 模型是不可逆的.对于可逆性的进一步 
讨论可参见本书 2.6.5 节. 

2.5.2 识别 MA 的阶 

自相关函数是识别一个 MA 模型的阶的有用 工具. 如果时间序列 r t 具有自相 
关函数仍， 若〜铃 0,但对！ > (/ 有内= 0,则服从一个 MA ( g ) 模型. 

图 2-8 所示的是 CRSP 等权重指数 ( equal-weighted index ) 从1926年1月 
到1的7年12月的月简单收益率的时间图和样本自相关函数图在样本自相关函 
数图中有两条虚线，它们是两个标准误差的卜、下限可见，该序列的自相关系数在 
间隔为1, 3, 9时显著.对更大的间隔也有稍显著的，但在这里我们不作考虑.基于 
样本自相关函数，我们给该序列建立下面的 MA (9) 模型： 

Tt = cq-\- at — 6iat-\ — O^at^s — 一 9. 

注意到，与样本 PACF 不同，样本 ACF 提供了模型非零 MA 延迟项的信息 • 

( r ) 月简单收益率 

0.6 
B 0.4 

I . °- 2 


0.4 
0.2 
0.0 

< 

-0.4 

图 2-8 CRSP 等权重指数从1926年1月到1997年12月的月简单收益率的 
时 fBj 囝和样本自相关函数图 
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2.5.3 估计 

估计 MA 模型通常用最大似然法.有两种方法求 MA 模型的似然 函数第 
一种方法是假设初始的“扰动”(即 a t ，t < 0) 都是0,这样由 q = n - co , a 2 = 
r 2 - co ^ e iai , ...， 可递推得到计算似然函数所需要的“扰动”.这种方法称为条件 
似然法，所得的估计是条件最大似然估计.第二种方法是把初始“扰动” at , < 0) 
当作模型的附加参数与其他参数一起估计出来，这种方法称为精确似然法.精确似 
然估计优于条件似然估计，尤其是当 MA 模型接近于不可逆时.然而，精确似然估 
I 十的计算会更复杂些.如果样本量较大，这两种似然估计是接近的.关于 MA 模 
型精确似然估 II 和条件似然估计的有关细节方面的讨论，读者可参阅 Bux ， Jeukim 
和 Reinsel (1994) 的书或本书笫8章. 

作为例子，我们来考虑 CRSP 等权重指数的月简单收益率 序列， 建立一个 MA ⑼ 
模型.用条件最大似然法拟合的模型为 

r t = 0.013 + 处 + 0.181 a t _i - 0.121 a t _ 3 + 0.122 a t _ 9 , er a = 0.072 4, (2.23) 

其中系数估计的标准误差分别为 0.003 0,0.032, 0.032 和 0.032. 残差的 Ljung-Box 
统计童为 Q (12) = 15.0, 基于自由度为9的 x 2 分布的 p 值为 0.091. 看起来.模型 
对于数据线性动态依赖关系的刻画是充分的.用精确最大似然法拟合的模型为 


r t = 0.013 + a t + 0.183 a t _i - 0.120 a t 一 3 + 0.123 a ( _ 9 , a a = 0.072 4, (2.24) 

其中各估计的标准误差为 G .003, 0.032, ().032 和 0.032. 残差的 Ljung - Box 统计量为 
Q (12) = 15.2, p 值为 0.086. 所拟合的模型也是充分的.比较 （2.23) 和 (2.24), 可见， 
对这样个具体例了来说，条件似然法和精确似然法的差别是可以忽略的. 

2.5.4 用 MA 模型预测 

MA 模型的预测很容易做因为模型具有有限记忆性，它的点预测就会很快达 
到序列的均值.为了说明这 一点： 设预测原点为 h 凡为在时刻所能得到的信息 
集合.对 MA (1) 过程的向前一步预测，由模型知 

Th+i = co + a/j+i — 0\ah- 

取条件期望我们有 

ffc (1) = E ( r/» + i \ Fh ) =cq- & ia h , 

Cfc (1) = r/i+i — fh (1) = a/i+i. 

向前一步预测误差的方差为 V ^[ e h ( l )]= al . 在实际中 ，卟 这个量可由几个方式得 
到，例如可假定= 0,则有別= n - co , 而 a t , 2 < t $ / i 可由= r t -co + ho ., 一 i 
递推得到.另外，还可用 MA (1) 模型的 AR 表示来计算(参见 2.6.5 节). 




48 第 2 章线性时间序列分析及其应用 


关于向前两步预测，由方程 


» Vh2 = Co 4- a/,+2 — 


我们有 


f h (2) = E (r h+ U = co ， 
e/i (2) = u+2 一〜⑵ = ah+2 - 0\ah+i. 

预测误差的方差为 Var[ eft (2)J= (1 I 01)^1 这是模型的方差，它大子或等丁-向前 
一 步预测误差的方差.上面的结果表明 MA(1) 的向前两步预测即是模型的无条件 
均值，这一点对任意预测原点 /!. 都正确.般地，以 ⑷ = cq,1^2. 总而言之，对一 
个 MA(1) 模型，以 / t 为预测原点的向前一步预测为 c o -0ia h , 向前多步预测为模 
型的无条件均值 CQ . 如果我们画出心 （0 对/变化的图像.会看到从一步以后预测 
值成一个水平直线.因此,对于 MA(1) 模型而言，均值回转只需要一个时间周期. 
类似地，对 MA(2) 模型，我们有 


rh+i = co + afc+z - ^iAh+t-L — 

由此得到 

h ( 1 ) = cq - Oian - O^ah-i, 
rh (2) — Cq -6 2 ah , 
rn (/) = eo , Z > 2. 

这样， MA (2) 模型的向前两步以后的预测即达到序列的均值，两步以后预测误差的 
力差也是序列的 方差. 一般地，对一个 MA ⑷模型，向前？步以后的预测就达到了 
模型的均值. 

表2- 3 给出的是 (2.23) 式中对等权重指数的月简单收益率建立的 MA (9) 的一 
些预测值.预测原点为 /I = 926(2003 年2月) • 序列的前926个观察值的样本均值 
和样本标准差分别是 0.01 2 ( i 和 0.075 L 正如所料，该表说明： （ a ) 向前10步预测 
值即为样本均值； （ b ) 当预测步数增加时预测误差的标准差趋于序列的标准差. 


表 2 -3 CRSF 等权重指数月简单收益率拟合 MA (9) 模型时的预测表现、 
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a 预测原点为 h = 926,即2003年2月，模艰的估计是用条件最大似然法得到的. 
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小结 


我们对 AR 和 MA 模型进行一个简短的总结.木节讨论了以下一些 性质： 

•对 MA 模型， ACF (自相关函数）是定阶的有力工具，因为对 MA ⑷ 序列， ACF 
是7步截 尾的； 

•对 AR 模型， PACF (偏 自相关 函数）是定阶的有力工具，因为对 ARCp) 过程， 
PACF 是 p 步截 尾的， 

• MA 序列总是平稳的，而对 AR 序列，当其特征根的模都小 r 1 时，它是平稳 
的： 

• 对一个平稳序列，向前多步预测收敛到序列的均值，预测误差的方差收敛于序 
列的方差. 


2.6 简单的 ARMA 模型 


在有些应用中，我们需要高阶的 AR 或 MA 模型才能充分地描述数据的动态 
结构.这样就有很多参数要估计，问题变得繁琐了.为了克服这个困难，人们提出了 
自回归滑动平均 （ ARMA ) 模型.参见 Box , Jenkins 和 R ^ insel (1994). 基本思想是 
把 AR 和 MA 模型的想法结合在一个紧凑的形式中，使所用参数的个数保持很小. 
对金融中的收益率序列，直接用 ARMA 模型的机会较少.然而， ARMA 模型的概 
念与波动率建模有密切关系.事实上，广义自回归条件异方差 ( GARCH ) 模型就可 
以认为是对的 ARMA 模型，尽管是非标准的.第3章中会详细讨论这一点. 
本节将研究最简单的 ARMA (1,1) 模型. 

称一个时间序列 n 服从 ARMA (1,1) 模型.如果 r , 满足 

r< — <f>irt-i = at — 6\a t ~u (2.25) 

其中是白噪声序列. (2.25) 式的左边是模型的 AR 部分，右边是 MA 部分，常 
数项为 00. 为使这样一个模型有意义，要求否则，在方程的两端消去一个 
公因子，方程所决定的过程就变为了一个白噪声序列. 

2.6.1 ARMA (1，1) 模型的性质 


ARMA(1 ， 1) 模型的性质是 AR(1) 模型的相应性质的推广，只是作些小的修 
改来处理 MA(1) 部分的影响.首先讨 论甲稳 性条件.在 (2.25) 式两端取期望，得到 

E(n) - ^iE(r t -i) = <i>o 4-E (a<) — 6>iE (a»_i). 

因为对所有的 i , 都有 E ( ai )=0, 所以只要序列是弱平稳的、则 r t 的均值为 

E ⑹ = 
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此结果和 （2.8) 式 AR (1) 模型的结果完全一样. 

为简单起见，假定 ^ = 0. 下面我们考虑 n 的自协方差函数首先，在模型两 
端乘以山再取期望，我们有 

E ( r t a t ) = E ( a ?) - 0 iE ( a t a e _ i ) = E ( a ?) = aj , (2.26) 

把模型改写成 

rt = -fa* - 没 ia t _i ， 

在上式两端取方差，得到 

Var ( r <) = 0 ?Var ( r t _ i )- I - 0^ - 20 i^E ( r t _ ia t _ i ). 

这里用到与山不相关这一事实.利用等式 (2.26), 我们得到 
Var ( r <) - 0 jVar ( r t _ i ) = (l - 2<}>\6\ + Q \) a \. 

从而，若序列 r < 是弱平 稳的，则 Var ( rt ) = Var ( rt - i ), 且 

Var ( rt 卜 巧⑼吃 

因为方差是正的，故要求# < 1( 也即 IAI < 1). 这又与 AR (1) 模型的平稳 性条什 
一样了 • 

为了得到 r t 的自协方差函数.我们假定如= 0,并在 (2.25) 式两端乘以 rm 

得到 

TtTt-i — <hn-irt-i = utr t -i — 6iat-irt-i. 

对/ = 1，在上式两端取期望并利用 I ! - 1时的 （2.26) 式，我们有 
7 i — 01 To = -01^1 

其中7< = Cov ( rt , r t ,). 这个结果不同于 AR (1) 情形，对 AR ⑴模型有- ^7 o = 
0 . 然而，对/ = 2,取期望后得到 

72 - 0171 = D, 

这与 AR ⑴情 形样. 事实上.用相同的方法可得到 

7 /— =0， I > 1. (2.27) 

对于 ACF , 上述结果 表明： 对平稳 ARMA ( l t l ) 模型，有 

pi = <h — ， pi = <Pipi-i, l> 1. 

7 o 
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这样， ARMA (1，1) 模型的 ACF 很像 AR (1) 模型的 ACF , 不同之处仅在于它的指 
数衰减是从间隔2开始的.因此. ARMA (1,1) 模型的 ACF 不能在任意有限间隔后 
截尾. 

现在来看偏自相关函数 ( PACF ). 可以 证明： ARMA (1,1) 模型的 PACF 也不能 
在有限间隔后截尾.它与 MA (1) 模型的 PACF 表现很相似，只是指数衰减从间隔 
2 开始，而不是从间隔1开始 

综上所述， ARMA (1,1) 模型的平稳性条件与 AR (1) 模型的相同， ARMA (1,1) 
模型的 ACF 与 AR (1) 模型的 ACF 形式相似，只是这种形式从间隔2处开始. 
2.6.2 —般的 ARMA 模型 

—般的 ARMA { p , q ) 模型的形式为 

V Q 

r t = <(>0 + < f > ir t -i + E 氏 a t - i ， 

*=1 t=i 

其中 { aj 是白噪声序列. p 和(/都是非负整数. AR 和 MA 模型是 ARMA ( p , (?) 的 
特殊情形.利用向后推移算子，上述模型可写成 

- ( P P B p ) n = 鈿 十 (1 一 - 0 q B 9 ) at . (2.28) 

模型的 AR 多项式是 1 ... < f > pB p , MA 多项式是 1 一 0 \S — ... — OqD ^ . 

我们要求 AR 多项式和 MA 多项式没有公因子，否则模型的阶（;;， (/) 会降低.如 
AR 模型一样， AR 多项式引进了 ARMA 模型的特征方程.如果特征方程所有 
根的绝对值都小于1，则该 ARMA 模型是弱平稳的.这时，模型的无条件均值为 

E ( r t ) = < f > o / (1 — 0 i — 令 p ). 

2.6.3 识别 ARMA 模型 

在给 ARMA 模型定阶时. ACF 和 PACF 都不是很有用的. Tsay 和 Tiao (1984) 
提出一个新方法，利用推广的自相关函数 ( EACF ) 来确定 ARMA 过程的阶 . EACF 
的基本思想相当简单.如果我们能得到 ARMA 模型的 AR 部分的相合估计，则能 
导山 MA 部分.对所导出的 MA 序列，用 ACF 决定 MA 部分的阶. 

EACF 的导出相对复杂一些，细节参见 Tsay 和 Tiao (1984). 但此函数很容易 
使用. EACF 的结果可以用一个—维表格表示，这个表的行对应于 AR 的阶 p ， 列对 
应于 MA 的阶 AR . MA (1,1) 模型的 EACF 的理论形式由表 2-4 给出.这个表的主 
要特 征是： 它包含由 “ O ” 组成的三角形，并且这个三角形左上角顶点位于阶 (1,1) 
处.我们止是用这样的特征来识别一个 ARMA 过程的阶.一般地，对 ARMA ( p , q ) 
模型，由 “0” 组成的三角形的左上角顶点位于 （ p ， g ) 处. 

作为例子，考虑 3 M 公司股票从1946年2月到1997年12月的月对数收益率. 
共有623个观测值，收益率序列和它的样本自相关函数由图 2-9 所示. ACF 图表明 
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在5%的水平下序列没有显著的序列相关性.表 2-5 给出了样本 EACF 的值和对应 
的简表.简表是用如下记号来构 造的： 

(1) “ x ” 表示对应的 EACF 的绝对值大于或等于 2/%/ T , 该值是 EACF 渐近标 
准误差的 两倍； 

(2) tt 0” 表示对应的 EACF 的绝对值小于 2/ y / T . 


表 2*4 ARMA (1,1) 模型的 EACF 理论表，其中 “ x ” 代表非零，“0” 代表零， 
代表零或者非零，它在识别阶 (1,1) 时不起任何作用 



问明 

图 2-9 3 M 公司股票从1946年2月到1997年12月的月对数收益率的 
时间阁和样本自相关函数图 

简表清楚地显示由 “0" 组成的三角形的左上角顶点位于阶 （ p ， g )=(0,0 ) 处.只 
有第一行的一个 “ x ” 是例外的，它对应的的样本 EACF 值为 0.09, 只比 2/ v /623 = 
0.08 稍大一点.因此, EACF 表明 3 M 公司股票的月对数收益率服从一个 ARMA (0,0) 
模型（也就是一个白噪声序列).这与由图 2-9 中样本 ACF 所表明的是一致的. 







2.6 简单的 ARMA 模型 53 


表2>5 3 M 公司股票从1946年2月到1997年12月的月对数收益率的 
样本 EACF 及其简表 

样本推广的自相关藏 


MA 的阶：</ 


尸 

U 

I 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

0 

-0.05 

-0.04 

-0.07 

-0.C1 

U.02 

0.06 

-0.00 

0.02 

-0.01 

—0.06 

0.03 

0.09 

0.01 

1 

-0 49 

0.01 

-0.06 

-0.03 

0.00 

0.06 

0.01 

0.01 

一 0.01 

-0.05 

0.02 

0.U8 

0.02 

2 

-0.45 

-0.18 

-0.05 

0.01 

-0.02 

0.06 

0.03 

0.02 

-0.01 

一 000 

0.01 

0.05 

0.05 

3 

-0.18 

0.15 

0.40 

-0.01 

-0.01 

0.05 

-0.00 

0.03 

-0.03 

-0.00 

0.00 

0.02 

0.05 

4 

0,42 

0.04 

0.39 

-0.08 

-0.01 

0.01 

-0.01 

0‘04 

0.02 

0.02 

-0.00 

0.01 

0.03 

5 

-0.13 

0.24 

0.41 

0.07 

0.23 

U.U1 

0.01 

0.05 

-0.03 

0.02 

-0.01 

0.00 

0.04 

6 

-0.07 

一 0.37 

0.06 

0.31 

0.20 

-0.09 

0.01 

0.06 

-0.03 

0.02 

-0.01 

0.0U 

1).03 

简化的 RACF •表 

MA 的阶： 9 

P 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

U 

O 

O 

O 

0 

o 

0 

o 

O 

6~ 

o 

o 

X 

o 

1 

X 

O 

O 

o 

O 

o 

o 

o 

0 

0 

o 

o 

o 

2 

X 

X 

O 

o 

O 

o 

o 

o 

o 

o 

o 

o 

o 

3 

X 

X 

X 

0 

o 

o 

o 

o 

o 

o 

o 

o 

o 

4 

X 

O 

X 

0 

0 

o 

o 

o 

o 

o 

o 

o 

o 

5 

X 

X 

X 

0 

X 

o 

0 

o 

o 

o 

o 

o 

o 

6 

o 

X 

O 

X 

X 

o 

o 

o 

o 

o 

o 

o 

o 


前面所讨论的信息准则也可以用来选择 ARMA 模型.具体地,对于事先指定的 
正整数 P 和 Q , 计算 ARMA ( p , q ) 模型的 A 1 C (或 BIC ), 其中0 《 p $只0 q < y ， 
并且选取使 AIC (或 DIC ) 取最小值的 模型. 该方法需要许多模型的最大似然估计 
在一些情形下可能会碰到在估计时过度拟合的 困难. 

一旦 AUMA ( p . (1 ) 模型的阶确定了，它的参数就可以用条件似然法或精确似然 
法来 估计. 另外，残差的 Ljung-Box 统计量可以用来检验所拟合模型的充分性.如 
果模型是正确的 ， Q ( m ) 渐近地服从自由度为 m _ 的 x 2 —分布其中 g 表示模型 
所用参数的个数. 

2 6.4 用 ARMA 模型进行预测 

和 ACF —样，只要将 MA 部分对低步数预测的影响进行调整后， ARMA ( P , q ) 
模型的预测就会与 AR ( p ) 椹型的预测有相似的特征.设预测原点为心凡为在 
时刻所能得到的信息集合 . 的向前一步预测为 


〜 (1) - E (r h+ i ) =知 + 5Z ^ r h+l-< - £ ^idh+l-i, 

1—1 

相应的预测误 差为弘 （1) = r/l+1 一心 （1) = a/|+1 . 向前一步预测误差的方差为 
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Var feh (1)] = a ^. 对向前^步预测，我们有 

p v 

( i ) = E { rh+i )= 如 + [ ( f>irh {I — «) - 5 Z ^ i(Lh ^ _ 

t=l *=1 

其中，当 Z - i 《 0 时， & U - i ) = r h 4 -/- t ； 当 r - i > 0 时，仙 （Z — i ) = 0; 当 f - i 彡 0 
时 a 7 l (/- i ) = / x M n 这样, ARMA 模型的向前多步预测可以递推 算得. 相应的预 
测误差为 

efe (0 = r^+i — rh (0 , 

它可以用 2.6.5 节给出的一个公式 (2.34) 很容易地算出. 

2.6.5 ARMA 模型的三种表示 

本节将简单地讨论平稳 ARMA ( p , q ) 模型的三种表示.这三种表示用于三种 
不同的目的.了解这二种表示会更好地理解 ARMA 模型. 第一种表示是（ 2 . 28 )式， 
这个表示很紧凑并且在参数估 il 时很 有用. 另外，它也可用亍递推计算^的向前 
多步预测，见 2.6.4 节的 W 论. 

对另外两种表示，我们用两个多项式比的级数展开式（长除法) • 给定两个多项 
式 0(0) = 1 - ，逆和 0( B ) = 1 - f ： 9 iB \ 我们有 

t=l <-1 


H 、 = 1 + + … 三矽 (*B ) ， (2.29) 

<P\B) 

rc 2 B 2 —— = tt(B). (2.30) 

0(B) 

例如 ， ^ 0iB, PllJ 

ip(B) = ^= 1 + (0i — 设 l) B (0i — 0i) B 2 + <pl (0i - 0i) S 3 +... ， 

1 — 

7r (J3) = ^ — = l — (^i — 9\) B - — By) B 2 — $i (0i — 0i) B 3 - . 

i — d\D 

由定义知 ip{B)n{B) = 1, 利用 Bc = c 对任意常数 c 成立这个事实（因为常数是 
随时间不变的)，我们有 

00 _ _00_ 00 _ _00_ 

^(1) = i-fii -V 雨 = 1 - 扣 - 知 . 

AR 表示 

利用 (2.30) 式的结果， ARMA(p, q ) 模型可写成 

r< =--- 珍 0 -+ rrirt-i 4- 7r 2 r t _2 + ?T3»*t-3 I- l-«t. (2.31) 

1 一 f/\ 一 • • • 一 Uq 
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这个表示给出了当前收益率 r t 对过去收益率 n-h i > 0的依赖关系.系数 {〜} 称 
为 ARMA 模型的 7 T - 权重.为了说明延迟值，对 n 的贡献随 7 :的增大而逐渐消 
失，系数〜应随/增大而趋于零.一个 ARMA ( p , q ) 模型如果具有这样的性质，则 
称它为可 逆的. 对纯 AR 模型,= 故 7 r ( B ) = 0( B ). 这是一个有限阶的多项 
式.从而对 i > p 有〜 = 0,模型是可逆的.对其他 ARMA 模型，可逆性的充分条 
件是： 多项式0 ( S ) 的所有零点的模大于 1. 例如，对 MA (1) 模型 r t = (1 - (9^)0*. 
一次多项式 1- AB 的零点是 B = \ J 9 y . 从而，如果1/|^| > 1( 也即|化| < 1), 则 
MA ⑴是可逆的. 

由 （2.31) 式的 AH 表示,一个可逆的 ARMA ( p , q ) 序列 r t 是当前的“抖动” 
与序列过去值的加权平均的线性组合.对越来越远的过去值，权重呈指数衰减. 

MA 表示 

同样,利用 （2.29) 式， ARMA ( p , q ) 模型也能写成 

rt — / J . + a t - 分 iat-i 十 thfH - 2 十 • . • = /i 十矽 (B)at, (2.32) 

其中 /z = E ( r t ) =如/(1-也- <}> p ). 这个表示清楚地说明了过去的“扰动” 

> 0) 对当前收益 rv 的影响.系数{也}称为该 ARMA 模型的脉冲响应函 
数 (impulse response function) 对弱平稳序列，系数 V ， i 随?: 的增加呈指数衰减. 
电 这一点是可以理解的，因为扰动山对收益率 n 的影响应该随时间而消失.这样, 

对平稳 ARMA 模型，扰动不能对序列有永久的影响.如果如# 0,这样的 MA 

表示中有一个常数项 T 它就是 n 的均值（也即如/ (1 一和 - 4> P )). 

(2-32) 式的 MA 表示在计算预测误差的方差时也是有用的.在预测原点 /*， 我 
们有 a ；», a h - i , -从而，向前 f 步预测为 

争 h (0 + + rpi + ia h -i + … ， (2.33) 

相应预测误差为 

c h (0 = «/ i+i + V ^ iO / i + z— 1 H — . + 咖一 ia / j +1. 

因此， 向前/ 步预测误差的方差为 

Var [e“f)j = (1 + 耐 + …+ 02， (2.34) 

正如所料，它是预测时间长度/的非减函数. 

最后， (2.32) 式的 MA 表示还提供了平稳序列均值回转的-个简单证明.平 
稳性意味着当 i — oo 时奶趋 于零. 从而，由 （2.33) 式，我 们有： 当 f —♦ oo 时， 
rn (0 - ti . 因为 r h (1) ^ r h + l 在预测原点的条件期望，丄述结果表示，从长期 
來看，收益率序列预期会趋丁它的均值，也就是说，序列是均值回转的.进一步地， 
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由 (2.32) 式的 MA 表示，我们有 Var ( r t ) = f 1 + 从而，由 （2.34) 式.当 

/ — ou 时, Var [ e h (/)]-» Var ( r t ). f h (/) 趋于 " 的 S 度决定了均值回转的速度. 

2.7 单位根非平稳性 

到目前为止，我们的注意力还是集屮在平稳的收益率序列上.在某些研究中， 
利率、汇举或资产的价格序列是研究对象.这些序列往往是非平稳的.对于资产价 
格序列，其非平稳性主要是甶 f 价格没有固定的水平.在时间序列文献中，这样的 
非平稳序列叫做单位根 ( Unit - root ) 非平稳序列.单位根非平稳序列最著名的例+是 
随机游动模型. 

2.7.1 随机游动 

若时间序列 { p t } 满足 

Pt = Pt - i + a t , (2.35) 

其中 P 。 是一个实数，表示这个过程的起始值，{^}是一个白噪声序列，则称 { Pt } 
为一个随机游动.若 Pt 为一支股票在第 f 天的对数价格.则 po 可以是该股票最初 
上市 (initial public offering ) 的对数价格（简称为“对数 IPO 价格”).若的分布 
关于零点对称，则给定 Pt -! 的条件下， Pt 上升或下降的机会各有50%,也即将 
随机地上升或下降.如果我们把随机游动模型看成一个特殊的 AR (1) 模型，那么 
Pt-i 的系数是1,这不满足 AR ,(1) 模型平稳性的条件.从而，随机游动序列不是弱 
平稳的，称之为单位根非平稳时间序列. 

随机游动模型町广泛地用来作为对数股价运动的统计模型.在这样的模型下, 
股价不是可预测的或均值回转的.下面说明这 一点： 模型 (2.35) 在蚀测原点 / J . 的 
向前一步预测为 

Ph (1) = E(p； l+ i \ph,Ph~U-') = Ph, 

它就是预测原点的对数股价，这样的预测没有实际意义.向前两步预测为 

Ph (2) = F<(pm a \p^x^Vh 1 ， .•.} = E ( ph+i 4 - (iu+2 \Ph-,Ph-\ ，. ..） 

= E(ph+i \phiPh~ir'-) =ph (1) =P/i. 

这又是预测原点的对数股价.事实卜.对仟意的预测步长 Z ：> 0,都有 

Ph (0 = Ph- 

这样，对所有预测步长，随机游动模型的点预测都是序列在预测原点的值.从而，该 
过程不是均值回转的. 
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(2.35) 式给出的随机游动模型的 MA 表示为 

Pt = + cit^i + at-2 + • • • • 

这个表示有几个重要的实际 意义. 首先，向前/步预测误差为 

e h (0 = o/i+/ + . • • + 叫 + 1 , 

从而 Var [ e * (/)] = ^，当 f — oo B 、 j 发散到 无穷. 因此，随着預测步长的增大， 

的预测区间的长度将趋于 无穷. 这表明，随着 f 的增大，点预测如⑴变得没有用 
处，也再次说明了该模型不是 0 J •预 测的. 其次，因为当/增大时， Var[e , (Z)] 趋于无 
穷， Pt 的无条件方差是尤 界的. 理论上讲，这意味着对充分大的（， pt 可取到任何实 
值. 对个股的对数价格忾来说，这一点还说得过去，但对市场指数来讲.负的对数 
价格即使有也是很少见的 ： 从这个意义上讲，随机游动模型对市场指数的适合性值 
得 怀疑. 最后，从上述表示看，对所有 i 有队 这就是说，任何过去的“ 扰动” 
山―， 对的影响均不随时间衰减.从而,序列有强记忆性，因为它记得所有过去的 
•‘扰 动”. 在经济学上，这种现象就是“扰动”对序列有持久的效应.单位根时间序列 
的强记忆性也可以从样本 ACF 看出来.当样本容量增大时，样本 ACF 都趋于 1. 
2 - T .2 带漂移的随机游动 

如前面一些实证例子所示，市场指数的对数收益率序列会有小的正均值这蕴 
涵着对数价格的模型应为 

P < + + o t , (2.36) 

其中 /z = E(^- P< _,), {^}是白噪声序列.模型 (2.36) 中的常数项在金融研究中 
很重要.它表示的是对数价格朽的时间趋势，通常称其为模型的漂移 （ drift ). 为 
了说明这一点，我们假定初始价格为 Pu , 从而我们有 

Pi =/^ + Po *f a lt 

P2 = A* + Pi + 02 = 2/X + Po + ^2 + fll, 


Pt = tfi + poat -\- ot_j -+•••• + oi. 

上式中最后一个等式表明对数价格由时间趋势仏和一个纯随机游动过程之 a ，鉬 

成•因为 Var daj = 4其中 d 为 a , 的方差， Pt 的条件标准差为 V ^ r a ，它比 
Pt 的条件 期望® 长的速度慢.从而,如果画出仍随时间指标/变化的图像，我们就 
有一个斜率为/,的时间趋势.正斜率^蕴涵着对数价格最终趋于％,负斜率 "蕴 
涵着对数价格将趋于 - oo . 基于这个讨论， CRSP 价值加权和等权重指数的对数收 
益率序列有小的、但是统计显著的正均值这个现象就不足为奇了. 
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为了说明价格序列漂移参数的效应，我们考虑 3 M 公司股票从年 2 月到 
1997 年 12 月的月对数收益率.如表 2-5 中的样木 EACF 所示，该序列无显著的序 
列相关性.该序列服从简单的模型 

r t = 0.011 5 + a t , a a = 0.0(53 Q , (2.37) 

其中 0.011 5 是 n 的样本均值，其标准误差为 0.002 6. 3 M 公司股票的月对数收益 
率在1%的水平下是显著不同于零的.我们利用对数收益率序列来构造两个对数价 
格序列： 

i t 

Vt = H r< » Pt = 

其中 a * 是 (2.37) 式中的均值修正对数收益率（也即叫 = r t - 0.011 5). p * 是 3 M 
公司股票的对数价格，假设初始价格为 0( 也即〗 946 年1月的对数价格为 0). p ? 是 
当对数收益率的均值为0时对应的对数价格.图 2 -10所示的是 Pt 和 p 〖 的时间图. 
还有直线讲= 0.011 5/. 从该图中可以看出， （2.37) 式中的常数 0.011 5的重要性是 
明显的.另外，如我们所料,抑上升趋势的斜率大致为 0.011 5. 


1900 1900 1970 1980 1900 20()0 

年 

图 2-10 3 M 公司股票从1946年2月到1997年12月的对数价格的时间图.假定1946年 
1月的对数价格为0虚线为没有时间趋势的对数价格,直线为 yr =0.011 5/. 

最后应指出的是，理解时 fBj 序列模型中常数项的意义是重要的.首先，对 (2.22) 
式中的 MA ⑷模型，常数项就是序列的 均值； 其次，对 (2.9) 式屮的平稳 AR ( p ) 
模型或 (2.28) 式中的平稳 ARMA ( p , g ) 模型，常数项与均值有关，关系为 p = 

0 o /(1-0, - 0 P ). 最后，对带漂移的随机游动，常数项成为了时间 斜举. 这 

些关于时间序列模型中常数项不同的解释.清楚地阐明了动态模型与通常的线性回 
归模型之间的不同. 

动态模型与回归模型之间的另—个重要差别可用 AR ( i ) 模型和简单的线性回 
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归模型来 说明: 


rt = 00 + 01 r<_i + 叫 ， m = /h + 0ixt+a t . 

要使 AR ( l ) 模型有意义，须使系数咖满足 |扣| < 1，而系数 A 可以是任何固定的 
实数. 

2.7.3 带趋势项的时间序列 

与刻画线性趋势紧密联系的一个模铟是如下带趋势项的时间序列 模型： 

Pt =00 + 0it + r t ， 

其中 n 是个平稳时间序列，例如平稳 AR ( p ) 序列.这里，随时间以 A 的速 
率线性增长，因此能够刻画类似于带漂移的随机游动模型的行为.然而，这两个模 
型有一个主要的区别.为了说明这一点，假定 po 是固定的.带漂移的随机游动模 
型假定均值是 E (内 ）= po + fit , 方差是 Var ( p t ) = 两者都依赖于时间.另一方 

面.带趋势项的时间序列模型假定均值是 E{p t ) = 如+队 它依赖于时间，而方差 
是 Var ( p f ) = Var ( rt ), 它是有限的且不随时间变化.带趋势项的时间序列模型可以 
通过简单的回归分析移除掉时间趋势而转换为平稳时间序列.关于对带趋势项的 
时间序列模型的分析,可参见 2.9 节. 

2.7.4 —般的单位根非平稳模型 

考虑 ARMA 模型.如果我们把 ARMA 模型推广到允许其 AH 多项式以1作 
为它的特征根.则模型就变成了众所周知的自回归求和滑动平均 (ARIMA) 模型. 
因为其 AR 多项式有单位根1，故 ARJMA 模型称为是单位根非平稳的.像随机游 
动模型一样， ARIMA 模型有强记忆性，因为它的 MA 表示中的也系数不随时间衰 
减，从而过去的扰动对序列有持久效应.处理单位根非平稳性的惯用方法是用 
差分化 (differencing). 

差分化 

个时间 序列讲 称为是个 ARIMA ^, 1, q ) 过程，如果交换后的序列 Ct = 
yt - yt-1 = (1 - B ) y t 服从一 个平稳可逆的 ARMA ( p , g ) 模型. 在金融中.通常认 
为价格序列是非平稳的，而对数收益率序列 n = ln ( p t ) - ln ( p t _!) 是平稳的.这时， 
对数价格序列是单位根非平稳的，从而可当作 AR 1 MA 过程对待.在时间序列文献 
中.通过考虑时间序列相邻两值的变化量所构成的序列.把一个非平稳序列变换成 
一个平稳序列，这样的思想叫做差分化.更正规地说，称 ct =讲 - 2/卜 丨为 的一 
阶差分序列.在有些科学领域，时间序列 y t 可能会有多重单位根，需要做多次差分 
才能变成平稳序列.例如，若识和它的一阶差分序列 c t = y t - y t ^ 都是单位根非 
平稳的，但 St = Ct - c t -i = Vt - 2 y t -i -f yt-2 是弱平稳的，则 za 就有双重单位根. 
是 Wt 的二阶差分序列.若〜服从 ARMA ( 7j , q ) 模型，则是 ARIMA ( p , 2, q ) 





60 第 2 聿线性时间序列分析及其应用 


过程. 对这样一个时间序列，若 St 有非零的均值，则讲有一个二次时间函数,这个 
二次时间函数的系 数与々 的均值有关.进行季节性调节后的美国季度国民总产值 
暗含的通货紧缩 （implicit price deflator ) 序列可能会有双重单位根.但该序列的二 
阶差分序列的均值并不是显著地不同于零的（见本章末的练习题). Box , Jenkins 和 
Reinsel (1994) 讨论了一般 ARIMA 模型的很多性质. 

2.7.6 单位根检验 


为了检验资产的对数价格内是否服从一个随机游动或一个带漂移的随机游动, 
我们利用如下两个模型 

Pt =< hpt - i + e t ， (2.38) 

Pt = <h + I c t , (2.39) 

其中 e * 为误差项.考虑原假设// 0 ： = 1对备择假设 // fl : 01 < 1. 这是一个著名 

的单位根检验问题.参见 Dickey 和 FuUer (1979). 一个方便的检验统计量就是在原 
假设下也的最小二乘估计的 f - 比.对 （2.38) 式，由最小二乘法可得 

ELi Pt-iPt .2 (内 _ 

4 = ^—， 

其中 P0 = 0, r 为样本容量 . 比为 


三 t — 比= 


▲的标准差- a . y/^pU 


这个 <- 比通常称为 Dickey - FuUer 检验.若 { e t } 是一个白噪声序列，其稍高干二 
阶的矩是有限的.则当7 1 — 00时 DF - 统计量趋于一个标准布朗运动的函数，更多 
的有关信息可参见 Chan 和 Wd ( 1988 ) 和 Phillips (1987). 如果 < P o = 0 但我们采用了 
( 2 .39)式，则所得的检验呶=1的 比将趋于另一种非标准的渐近分布.上述两 
种情形都是用模拟方法来得到检验统汁量的临界值，部分临界值参见 FiUler (1976) 
的第8章.然而，如果 知一 0 且使用的是 （2.39) 式，则用来检验和 - 1的 <-比是 
渐近正态的，但此时将需要很大的样本容量来保证渐近汇态分布的使用.标准布朗 
运动将在本 H ； 笫 G 章介绍. 

对许多经济时间序列而言， ARIMA ( p , d , q ) 可能比（ 2 . 3 . 9 )式给出的简单模型 
更适合.在 i | 量经济文献中，经常使用的是 AR ( p ) 模型 ，用心 表示该序列.为了验 
证在 AR ( p ) 过程中是否存在单位根，可以用如下回归来检验原假设％ : 0 = 1对 

H a ： P<Li 

P — 1 

xt =Ct-\- 0x t -\ + ^2, ^tAx t _4 + e< (2.40) 





其中 ^ 是关于时间指标/的确定性函数, Axj=xj 是: r, 的差分序列.在实 

际中，可以是零，常数,或者 c ^- uo +^ t . 彡―1的比为 


ADF- 检验 


/》的标准差’ 


其中 色为 的最小二乘估计,上述比就是著名的扩展的 Dickey-Fuller 单位根 
检验.注意到由于一阶差分， (2.40) 式等价于一个带确定性函数 r , 的 AR ( p ) 模型. 
(2.40) 还可以改写为 


ct 4- 各® i_i + + eu 


其中凡 = 沒 -1. 我们可以等价地检验队：氏= 0对札： 氏 < 0. 

例 2.2 考虑美国从1947年第一季度到2003年第4季度的季度 GDP 的对数 
序列该序列呈上升趋势.表明美国经济的增长，另外 t 该序列有高度的序列相关 
性，见图 2-11 的左侧.一阶差分序列表示美国 GDP 的增长率，这也在图 2-11 中 
给出. 该差分序列似乎在一个固定的均值附近变化，尽管这种变化在最近几年比较 
小.为了证实所观察到的现象，我们对数序列进行 Dickey - Puller 单位根检验.基 
于图 2 -11给出的差分序列的样本 PACF , 我们选择 p = 10. 我们还用了一些其他 
的 p 的值，然而都没有改变检验的结 论：当 p =10 时 ADF 检验统计量是-1.131， 





图 2-11 美国从1947年第一季度到2003年第4季度的季度 GDP 的对数序列： （ a ) 对数 
GDP 序列的时 间图； （ b ) 对数 GDP 序列的样本 ACF ; ( c ) 一阶差分序列的时 间图: 
( d ) 差分序列的样本 PACF 
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V 值是 0.703 8,表明单位根假设不能被拒绝.由下面的 S - Plus 输出结果知= 
1 + 瓦=1 - 0.000 6 = 0.999 4. 

S-Plus 演不 

输出结果. 

> adft=unitroot(gdp,trend=* c 1 ,method= , adf*,lags=10> 

> summary(adft) 

Test for Unit Root: Augmented DP Test 

Null Hypothesis ： there is a unit root 
Type of Te»t : t test 
Test Statistic ： -1.131 
P-value ： 0.7038 

Coefficients: 

Value Std. Error t value Pr(>|t|) 
lagl -0.0006 0.0006 -1.1306 0.2595 

lag2 0.3797 0.0679 5.5946 0.0000 

laglO 0*1798 0.0656 2.7405 0.0067 

constant: 0.0123 0.0048 2.5654 0.0110 

Regression Diagnostics : 

R-Squared 0.2831 
Adjusted R-Squar^d il. 2485 

Residual standard error : 0.009498 on 214 degrees of freedom 

作为另外一个例子，考虑 S & P 500 指数从1990年1月到2003年12月的曰对 
数收益率序列，共有3 532个观测值.图 2-12 给出了该序列的时间图-如果想从实 
证的角度去验证该指数是否服从带漂移的随机游动，则进行单位根检验是必要的. 


7.0 

輕 0.5 

6.0 

199U 1992 1994 1996 1098 2000 2(X)2 2004 

年 

图 2-12 S & P 500 指数从1990年1月2日到2003年12月31日的对数日收益率的时间图 
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为此,在应用扩展的 Dickey - Puller 检验时用 c t = u ) o + u ；\ t . 进一步，我们选择 p = 14， 
这是因为对子一阶差分序列， ATr 选择了 AR (13) 模型.检验统计量的倌为 -0.9648, 
V 值为 0.946 9. 因此，在任何合适的显著性水平下，单位根检验都不能被 拒绝然 
而，在通常的5%的显著性水平下，对确定性项的参数估计与零没有显著差异.综上 
所述，在所考虑的时期内，指数的对数序列包含一个单位根.但是没有很强的证据 
表明该序列有时间趋势. 

S - Plus 演示 
输出结果. 

> adft=unitroot(sp , method^ # adf # ,trend=*ct , , lags=14) 

> summary { adft ) 

Test for Unit Root : Augmented DF Test 

Null Hypothesis ： there is a unit root 
Type of Test : t test 
Test Statistic: -0,9648 
P-value: 0.9469 

Coefficients ： 

Value Std• Error t value Pr(>|t|) 
lagl -0.0008 0.0008 -0.9648 0.3347 

lagl4 0.0319 3.0169 1.8894 0.0589 

constant 0.0056 D.0054 1.0316 0.3023 

time 0.0000 D.0000 0.4871 0.6262 

Regression Diagnostics : 

R-Squared 0.0107 
Adjusted R-Squared 0.0065 

Residual standard error ： 0.01049 on 3514 degrees of freedom 

2.8 季节模型 

有些金融时间序列，如公司股票每股的季度盈利，呈现出一定的循环或周期性. 
这样的时间序列叫做季节性时间序列.图 '2-13 a 所示的是 Johnson aud Johnson 公 
司每一股份的季度盈利的时间图，时间是从 I 960 年第1季度到1980年最后一个 
季度.此数据集来自于 Shumway 和 Stoffer (2000), 它呈现出一些特殊的 特征. 特别 
地，我们可以看到在样本 期闾内 盈利呈指数型上升，并有很强的季节性.另外，随时 
间的推移，盈利的变化性在增加.其循环形式每年重复一次，从而此序列的周期是 
4. 如果我们考虑的是月数据（如 Wal - Mart 商店的月销售额)，则周期是 12. 季节性 
时间序列模型在给与天气有关的衍生产品定价和能源期货的定价方面也是有用的， 
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因为绝大部分与环境有关的时间序列都会显示出很强的季节性. 

季节性时间序列的分析已有很长的历史.在有鵠应用中，季节性的重要性是次 
要的，我们可把它从数据中 消除. 得到经季节性调整后的时间序列，然后再用来做 
推断.从数据中消除季节性的过程叫做季节调整 (seasonal adjustment). 美国政 
府公布的多数经济数据是经季节调整的（如 GDP 的增长率和失业率).在其他一些 
应用中，如进行预测时，数据的季节性和其他特征一样重要，必须进行相应的处理. 
因为预测是金融时间序列分析的一个主要 B 的，故我们把注意力放在后一个话题 
上，并讨论一些在季节性时间序列建模中有用的经济计量模型. 

2.8.1 季节性差分化 

图 2-13b 所示的是 Johnson and Johnson 公司每股对数盈利的时间图.我们进 
行对数变换有两个 原因： 一是处理序列的指数型增长1新的时间图证实了序列取对 
数后的确是线性增 长的； 二是对数变换用来稳定序列的波动性.图 2-13a 中的序列 
的波动有上升趋势，这种上升趋势在新图中已经 消失. 对数变换在佥融、经济的时 
间序列分析中是常用的.在这个貝体例子中，因为盈利是正的，所以在交换之前不 
须作 调整. 而在有些场合，我们需要对每个数据点加上一个正常数后再作对数变换. 

(*) 毎股盈利 


S 


年 

(>.) 每股对数盈利 

S 2 

友0 

年 

图 2-13 Johnson and Johnson 公司股票从1960年到1980年每股的季度盈利时 间图： 
(a) 观察到的祖利， 【b) 对数盈利 

记对数盈利为: r t •图 2- L4 的左上角是的样本自相关函数图，它表明每股的 
季度对数盈利具有强的序列相关性.处理序列的这种强序列相关性的一个惯用的 
方法是考虑的一阶差分序列（也即=心 - a— 1 = (1 - S)a:*). 图 2-14 的左 
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下角是的样本自相关函数图，可见当间隔是周期4的倍数时相关性强，这是季 
节性时间序列的样本自相关函数的典型表现.按照 Box ， Jenkins 和 R ^ insel (1994) 
的第9章的内容，我们对作另一个差分，也即 

△4 (Aar t ) = (1 — B 4 ) Ax t = Ax t - Aa: t _ 4 = x t x t -A + *t-a* 

算子 △‘ = 1 - B 4 叫做季节性差分化 (seasonal differencing). — 般地，对 一 个周 
期为 . s 的季节性时间序列 y t , 季节性差分意指 

^aVt =Vt- yt-a = (1 - B 8 ) y t . 

通常的差分 Aj/t = Vt — yt-i = (1 - B ) y t 叫做正规差分化 (regular differencing). 
图 2-14 的右下角是的样本自相关函数，它在间隔为1处有一显著的负值, 
在间隔为4时有一个稍强的负相关.为了完整性，图 2-14 还给出了季节差分序列 
的样本自相关函数图. 


序列 ：I 序列： d « 



5 10 15 0 5 1 () 15 

间隔 間隔 


图 2-14 Johnson and Johnson 公司股票从1960年到1980年每股季度盈利的对数序列的样 
本自相关函数，其中 x t 是对数盈利， “ da :” 是一阶差分序列， “ ds ” 是季节性差分序列， 
“ dxds ” 表示经止规差分后冉李节差分的序列 

2.8.2 多重季节性模型 

图 2-14 中 (l-B 4 )(l-B)x t 的样本 ACF 的表现在季节性时间序列中是常 
见的.它使我们引进了下面特殊的季节性时间序列模型： 

(1-B a )(l -B)x t = (l- OB) (1 - BB B )a u (2.41) 

其中 s 是序列的周期，是白噪声序列，|0| < 1，|0| < 1. 此模型在文献中称 
为航空模型 (airline model ), 见 Box , Jenkins 和 Reinsel (1994) 第9章.它被广泛 
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地应用于季节性时间序列的建模.此模型的 AR 部分由正规差分和季节差分两 
部分组成，而 MA 部分包括两个参数.下面将精力放在该模型的 MA 部分，记 
w t = (1 - B a ) (1 - B)xt , 那么 

= (1 - OB) (1 - QB a ) a t = at _ 0 a t -i — 0a(_ 3 + (90a f _ a _ 1? 

其中 s > 1 . 容易得到 E (叫） =()， 并且 

Var ㈣ -(1 + 0 2 ) (H-0 2 )^, 

Cov (w tl tot-i)= - 设 （1 + © 2 ) 

Cov (Wit, 叫 -«+ 1 ) = 00 ( 7 ^, 

Cov (w t , w t -s) = -G (l + 0 2 ) 

Cov (w tl w t - a -i) = OQal ， 

Cov {wt, U / t - t ) = 0 , 其中 l 0,1,. 9 - I ， S , 5 + 1 . 

因此，叫的 ACF 为 

-e -e ee 

P ' = TT¥' A, = IT© 1, Pa ~ l = Pa+1 = PxPa = (fT»2) (i + 02 ) ， 

而对/ > 0 但 /> 1 ,. 9 一 1 ，.《，《+ 1 有内= 0 . 例如，如果 《；, 是季度时间序列，那么 
s = 4 且它的 ACF 只在间隔1，3, 4, 5处非零. 

把卜述 ACF 与 MA (1) 模型 ? /t = (1 - flB ) 叫和 MA ⑷模型 z t = (1 - GB^)a t 
的 ACF 相比较会看出有意思的结论 . 和&的 ACF 分别是 

Pi (y) = i^02 和灼 （ w) = 0 ， l > l ； 

P» (-*) = 02 和灼 （名） = 0， 名 > 0 且 If a. 

我们看到 ( a)/>i = pi (y); ( b ) p„ - p a ( 2 ); ( c ) p 4 _i = p a+ i = Pi ( y ) x p M («). 从而， u; t 
在间隔 s - 1 和 《 + 1 处的 ACF 可以认为是间隔为1和间隔为 . s 的序列相关性相 
互作用的结果.叫的模型称为多重季节性 MA 模型.实际中，多重季节性模型意 
味着序列的正规部分与季节部分的动态结构是近似正交的. 

模型 

w, =(l-BB-GB a )a t , \0\ < 1, |0| < 1 (2.42) 

是一个 非乘枳季节性 MA 模型.易见，对 (2.42) 式的模型有 p a+1 = 0. 乘枳模型比 
对应的非乘枳模型更节省，这是因为虽然网个模型用/相同数目的参数.但乘积模 
型有更多非零的 ACF . 
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例 2 .3 在此例中，我们把航空模型应用到 Johnson and Johnson 公司股票从 I 960 
年到 1980 年的每股季度盈利的对数序列上去.基于精确似然法所拟合的模型为 

(1 - B ) (1 - B 4 ) x t = ( l - 0.678 S ) (1 - 0.314 J 3 4 ) a t , & a = 0.089, 

其中两个 MA 参数的标准误差分别为 0.080 和 ().101. 残差的 Ljung - Box 统计量为 
Q (12) = 10.0, 其 p 值为 0.44. 模型看起来是充分的. 

为了说明上述季节性模型的预测表现，我们利用前76个观察值重新估计模型 
的参数，而把最后 8 个数据点用来进行预测 评价. 以 /i = 76为预测原点计算向前 
1步至8步预测值和它们的标准误差.为得到每股盈利的预测值，利用第1章中给 
出的正态分布与对数正态分布之间的关系，先进行一个反对数变换.图 2-15 给出了 
，型的预测表现，其中实线表示实际观察值，点预测值用一些点表示，两条虚线所 
示的是95%的区间预测.预测值显示出强烈的季节性，并与实际观察值相近.最后， 
对季度盈利建模还有其他方法，可参见本书 11.7 节. 

当一个时间序列的季节性表现随时间稳定的（也即，近似于确定性函数）时候， 
可用哑变量 (dummy variable ) 来处理季节性.有些分析师就采用这种方法.然而， 
确定的季节性只是前面讨论的乘积季节性模型的一个特殊情形，如0 = 1时.模 
型 （2.41) 包含一个确定的季节性成份.因此，当季节件是确定的时候.用哑变量或者 



图 2-15 Johnson aud Johnson 公司股票毎股季度盈利的点预测和区间预测.预测原点是1078 
年的第4季度.实线表示实际观测倌，黑点表示点预测值两条虚线表示的是95%的 
区间预测 

用乘积季节性模型都能得到相同的预测结果.但是，当季节性不确定的时候，哑变 
量方法会导致较差的 预测. 在实际中，我们建议用精确似然法去估计一个乘积季节 
性模型.特别是当样本容量较小或可能存在一个确定的季节性成份时. 

例 2 . 4 为了说明确定性的季节性，考虑 CRSP Decile 1指数从1960年1月到 
2003年 I 2 月的月简单收益率,共有528 个观测.图 2-16 a 给出了序列的时间图，该 
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图并没有显示出序列有季节性.然而，图 2-16 b 给出的样本 ACF 在间隔为12, 24, 
36以及1处显著的不为 0. 如果接受季节 ARMA 模型.则模型具有以下 形式： 

(1 — < h 2 B 12 ) R t = c +( l - e l 2 B l 2 ) at , 

其中风表示月简单收益率.用条件似然方法所拟合的模型是 

(1 - 0.25 B )(1 - OMB 12 )^ = 0.0004 + (1 - 0.92 丑 12 ) a t ， d a = 0.071. 

MA 系数靠近1,表明所拟合的模型接近于不可逆.如果用精确似然方法，我们有 

(1 - 0.264 S )(1 - 0.996 fl 12 )/2 t = 0.0002 + (1 - 0.999 B 12 ) o tl a a = 0.067. 

(«) (c) 



间閛 间隔 

图 2-16 CRSP Decile 1 指数从 196() 年 1 月到2003年12月的月简单收益率： （ a ) 简单收益 
丰的时 间图； （ b ) 简单收益率的样本 ACF ; ( c ) 调整1月效应后的简单收益率的时间 
图； （ d ) 调整1月效应后的简单收益率的样本 ACF 

可以清楚地看到季节 AR 和 MA 因子之间的 取消. 利用精确似然方法以及估计的 
结果说明可能存在确定性的季节性.为了进一步证实确定性季节性的存在，我们关 
于1月份定义哑变量.即 



若在1月份内, 
其他. 


并应用简单的线性回归 


Rt = Aj + AJant + e t . 
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图 2-16 的右侧给出了上述简单线性回归残差的时间图和样本 ACF . 从样本 ACF 
来看，在仟何间隔为12的倍数处都没有序列相关性.这表明通过1月份哑变量已 
经成功地消除了季节性因此 , Decile 1的月简单收益率的季节性主要是由于1月 
效应 (January effect ) 产生的. 

SCA 演示 
输出结果. 

tsm ml. model (1)(12)decl=cl+(12)noise. 
estim ml. hold resi(rl) 


SUMMARY FOR UNIVARIATE TIME SERIES MODEL -- Ml 


VAR TYPE OF ORIGINAL 

VARIABLE OR CENTERED 

DEC1 RANDOM ORI3INAL 

DIFFERENCING 

NONE 




PAR. VAR. 

NDM./ 

FACTOR 

ORDER 

CONS- 

VALUE 

STD 

T 

LABEL NAME 

DENOM 



TRAINT 


ERROR 

VALUE 

1 Cl 

CNST 

1 

0 

NONE 

.0004 

.0003 

1-11 

2 DEC1 

MA 

1 

12 

NONE 

.9213 

.0205 

44.90 

3 DEC1 

AR 

1 

1 

NONE 

.2496 

.0419 

5.95 

4 DEC1 

AH 

2 

12 

NONE 

.9943 

.0094 

105.71 

EFFECTIVE NUMBER 

OF OBSERVATIONS 



515 


K-SQUARE • • 





0 . 

207 


RESIDUAL STANDARD 

ERROR.. 


.. 0 . 

705662E 

-01 



estim ml. method exact. hold resi(rl) 

SUMMARY FOR UNIVARIATE TIME SERIES MODEL -- Ml 


VAR. TYPE OF ORIGINAL DIFFERENCING 
VAR. OR CENTERED 


DEC1 RANDOM 


ORIGINAL 


PAR. VARI 

NUM./ 

FACTOR 

ORDER 

CONS- 

VALUE 

STD 

T 

LARET. NAME 

DENOM. 



TRAINT 


ERROR VALI 

1 Cl 

CNST 

1 

0 

NONE 

.0002 

.0002 

.67 

2 DEC1 

MA 

1 

12 

NONE 

.9989 

.0156 

63.99 

3 DEC1 

AR 

1 

1 

NONE 

• 2638 

.0424 

6.23 

4 DEC1 

AR 

2 

12 

NONE 

.9963 

.0058 

170.55 

EFFECTIVE 

NUMBER OF 

OBSERVATIONS 



515 


R-SQUARE . 





0.283 



RESIDUAL STANDARD ERROR. 


0.670734E-01 
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2.9 带时间序列误差的回归模型 


在许多应用中，主要的兴趣在于研究两个时间序列的关系.金融中的市场模型 
就是一例，其中，在市场模型中，我们需要找出个股收益率与市场指数收益率之间 
的关系.利率的期限结构也是一个例子，这时要研究的是不同期限的利率之间的关 
系怎样随时间演变.这些例子导致我们考虑如下形式的线性 回归： 

rit = a + 0 r 2 t + e *, (2.43) 

其中 r lt 和是两个时间序列，表示误差项.经常用最小二乘 （ LS ) 方法来估计 
模型 （2.43) .若是 G 噪声序列，则 LS 方法给出的估计是相合的.然而，在实际 
中经常遇到误差^是序列相关的情形.这时，模型 (2.43) 就是一个带时间序列误 
差的回归模型，并且最小二乘法 ( LS ) 所产生的 u 和的估计可能是不相合的. 

带时间序列误差的回归模型在经济、金触屮有广泛应用，但它也是最经常被误 
用的经济计量模型之一，因为 et 的序列相关性经常被忽视.故应该对此模型进行仔 
细研究. 

我们通过考虑如下两个美国的周利率序列之间的关系来介绍该模型. 

• r le ： 一年期固定期限国库券利率. 

• r 3 t ： 三年期固定期限国库券利率. 

这两个序列都以百分数给出，观测时间都是从1962年1月4日至1999年9月10 
曰，都有1967个观察值，并且是从圣.路易斯联邦储备银行得到的.严格来讲，应 
该利用第8章中的多元时间序列分析对这两个利率序列联合建模.然而，为了简单 
起见，我们将注意力放在冋归类型的分析卜.， 并目忽 略它们的同时件. 

图 2-17 是上述两个利率序列的时间图，实线是一年期的 利率， 虚线是三年期的 
利率.图 2-18 a 是/ ' u 对 r * 2 l 的散点图，正好弓预期的一样，这两种利率是髙度相关的 • 
描述这两种利率之间的关系的一个自然方式是利用简单的模型 = a + (3 r it + c t} 
所拟合的模型是 

r M = 0.911+ 0.924 r u | c t , < r e = 0.538, (2.44) 

其中 i 2 2 = 95.8%, 两个系数的标准误差分别为 0.032 和 0.004. 模型 (2.44) 证实 
了两种利率之间的高度相关性.然而，由图 2-19 所不的该模型残差的时间图及残 
差的 ACF 可见，该模型是严重地不充分的.特别地，残差的样本 ACF 是高度显 
著的并且缓慢衰减.显示出单位根非平稳时间序列的特点.残差的表现说明两种利 
率间存在明显的差异.利用现代经济计量方法，如果我们假定两个利率序列都是单 
位根非平稳的，那么 (2.44) 式中残差的表现说明这两种利率序列不是协整的 （《>• 
integrated ) (见第8章中关于协整的讨论).换言之,数据不支持关于两种利率间存 
在长期均衡关系的假设.从某种意义上讲，这并不让人感到意外，因为“逆收益曲 
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线 ” (inverted yield curve ) 在数据所在的时间段内出现了. “逆收益曲线”指的是利 
率与它们离到期日的时问长短逆相关. 



m 2-17 从1%2年1月4日到1999年9月1(〗日美国周利率（百分比）的时间阁.实线是一 
年期固定期限国库券利率，虚线是三年期固定期限国库券利率 


I — I — I ~~ I — I — I— I — | — I— i | — I— r 

4 6 8 10 12 14 16 -1.5-1.0 -0.5 0.0 0.61.0 1.6 

一年期 一年期利率 变化& 

图2 18 从1962年1月5日到1999年9月10日 美国周 利率的 散点图 ： （ a ) 三年期对一年 

期; (b) 三年期利率的变化惫对一年期利卒的变化量 

两个利率序列和 (2.44) 式中的残差的单位根非平稳性使我们想到了考虑利率 
变化量序列. 

令 

(1) c u = r u - n . t-j =( l - B ) r lt , t ^2： 一年期利率的变 化量； 

(2) C 3 t = r^i — r 3 ,f —1 = (1 — B ) r 3<, < ^ 2： 三年期利率的变化童， 



I I _ 剩 I 

5 0 5 0 5 
Ll.o.d-o. 

制 sflf-ts 济 111 










图 2-19 两种美国周利举的线性回归 (2.44) 式的残差序列： （ a ) 时间图： （ b ) 样本 ACF 

并考虑线性回归 c 3t = a +/3 c lt + e t •图 2-20 所示的是两个变化量序列的时间图, 
而图 2-18 b 所示的是它们之间的散点图.这两个变化序列仍然是高度相关的.为它 
们拟合的线性回归模型为 

c 3t = 0.000 2 + 0.781 leu + e t ， a K = 0.068 2, (2.45) 

(a) 


1970 1980 1990 2000 

年 

•f 


l{17n 1080 1990 2000 




年 

图 2-20 从 1962 年 1 月 12 日到1999年9月10日美国周利率变化量序列的时 间图: 
( a ) 一年期固定期限国库券利率的变化； （ b ) 三年期固定期限国库券利率的变化 
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其中丑 2 = 84.8%,两个系数的标准误差分别是 ().001 5和 0.007 5. 此模型进一步证 
实了两种利率间很强的线性相关性.图 2-21 给出了 (2.45) 式的残差的时间图和样 
本 ACF , 这个样本 ACF 又表明残差中有一些显著的序列相关性.但相关系数的绝 
对值要小得多.残差的这种弱序列相关性能用前面几节中讨论的简单时间序列模 
型来描述.从而得到一个带时间序列误差的线性回归. 


⑷ 



间_ 

阁 2-21 两种美国周利率变化的线性冋归 (2.45) 式的残差序列： （ a ) 时间图： （ b ) 样本 ACF 


本节的主要任务是讨论一个简单方法来建立带时间序列误差的线性回归模型. 
这种方法是直接的.我们对残差序列选用一个本章所讨论过的简单时间序列模型， 
然后把整个模型联合估计出来.作为说明，考虑 （2.45) 式中的简单线性回归.因 
为模型的残差是序列相关的，所以我们给残差识别一个简单的 ARMA 模型.从图 
2-21 的样本 ACF 看出， MA (1) 模型对残差序列是适合的，把线性回归模型修改为 

cat = ex + Pen + e “ et — dt ~ 设 (2.46) 

其中 {〜} 是一个白噪声序列.换句话说，我们简单地用不带常数项的 MA (1) 模型 
来刻画 （2.45) 式中的误差项的序列相关性.结果得到的模型是带时间序列误差的 
线性回归模型的简单例子.在实际应用中，可把更复杂的时间序列模型加到线性回 
归方程上太，形成一般的带时间序列误差的回! d 模型. 

在现代计算机山现之前，估计带时间序列误差的回归模型不是件容易的事. 
人们提出一些特殊的方法，如 Cochrane - Orcutt 估计量，来处理残差中的序列相关 
性 （见 G reene (2000) 第 546 页).但现在这种估计与其他时间序列模型的估计一样 
容易.若所用的时间序列模型是平稳的、可逆的，则可用最大似然法把模型一起估 
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计出来.这就是我们应用 SCA 软件包所采用的方法.对美国的周利率数据.所拟 
合的形如 (2.46) 式的模型为 


c 3t = 0.000 2 + 0.782 4 c u + e t , e t = a t -\- 0.211 5 o t _ i , & a = 0.066 8, (2.47) 

其中 /? 2 = 85.4%, 参数的标准误差分别为 0.001 8, 0.00 7 7 和 0.022 1,此模型不再 
有显著的间隔为1的残差 ACF , 虽然在间隔为 4 和 6 时残差有较小的序列相关系 
数，但是，如果在残差方程中加上间隔为 4 和 G 的 MA 系数，结果的改逬并不大, 
具体细节在此不作 W 论. 

比较 (2.44) 式、 (2.45) 式和 (2.47) 式这三个模型，我们观察到如下几点：第一， 
(2.44) 式的高/? 2 和系数 0.924 会导致人们的错误认识，因为该模型的残差有强烈 
的序列相关性.第二，对利率变化置序列， (2.45) 式和 (2.47) 式的 K 2 和⑺的系数 
都很接近，这说明对这个具体例子来说，对变化序列加上一个 MA (1) 模型得到的改 
进不大.这并不出人意料，因为估计出的 MA 系数尽管是高度统计显 著的. 但它不 
是较大的数值.第三，上述分析表明在线性回归分析中检验残差的序列相关性很重 
要. 

因为 （2.47) 式中的常数项不显著.该模型表明前述两个周利率序列有如下关 
系： 

rat = T 3, i -\ + 0.782 (rn — n ， t-i) + at + 0.212 a f _ i . 

这两种利率是相互影响并序列相关的. 


小结 

我们给出分析带时间序列误差的线性回归模型的一般 步骤： 

(1) 拟合一个线性回归模型并检验其残差的序列相 关性； 

(2) 如果残差序列是单位根非平稳的.则对因变景和自变量都作一阶差分.然 
后对两个差分后的序列进行第 （1) 步.若这时的残差序列是平稳的，则对残差识别 
—个 ARMA 模型并相应地修改线性回归模型. 

(3) 用最大似然法进行联合估计，并对模型进行检验看一看是否需要进一步改 
进. 

为检验残差的序列相关性，我们推荐使用 Ljung - Dox 统计量，而不是 Durbin - 
Watson ( DW ) 统计量， 囚力 后者只考虑间隔为1的序列相关性.有时残差的序列相 
关性表现在高阶间隔上，尤其是在所涉及的时间序列呈现某种季节性的时候. 

注释：设有残差序列的 r 个观察值， Durbin-Watsori 统计量是 


DW 


ELM 


直接计算表明 DW «2( l - pi ), 其中 6 是 { e t } 的间隔为 1 的 ACF . 
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在 S - Plus 中可以用命令 OLS (普通最小二乘）来分析带时间序列误差的回归 
模型，该命令假定残差服从 AR 模型.为了识别延迟变量.可以用命令 tslag . 例如 
y = tslag ( r , 1). 下面给出了关于利车序列的相关命令，这里％表示对命令的注释. 

□ 

> da=matrix(scan(file= # w-gsln36299.txt # ),3) % load data 

> rlt=da tl,] 

> r3t-da [2 # ] 

> fit=0LS(r3t-rlt) 

> summary (fit) 

> c3t=diff(r3t) 

> clt^diff(rlt) 

> fitl=0LS(c3t-clt) 

> summary(fitl) 

> fit2=oiiS (c3t-cit+tslag (c3t, i) +tslag (clt # 1) , na. rm*T) 

> summary(fit2) 

为得到更多的信息参见 2.10 节的输出结果. 


% fit the first regression 
% take difference 
% fit second regression 


2.10 协方差矩阵的相合估计 

仍然考虑 （2.43) 式给出回归模型.可能存在这样的 情形： 误差项^存在序列 
相关性或条件异方差性，然而我们分析的目标却是关于回归系数《和0做推断.对 
条件异方差性的讨论参见第3章.在系数的最小_乘估计仍然是相合估计的情形 
卜，巳经有方法给出系数协方差矩阵的相合估计，应用比较广泛的有两种方法.第 
一种方法称为异方差相合 （ HC ) 估计.参见 Eicker (1967) 和 White (1980). 第二种方 
法称为异方差及自相关相合 （ HAC ) 估计，参见 Newey 和 West (1987). 

为了容易讨论，我们将回归模型改写为 

= + i = 1, (2.48) 

其中是因变量,= ( i u , ••-，咖) ' 是由包含常数项在内的自变量所构成的 fc 维 
向量，冷=(负 ，… ,PkY 是参数向量.这里 〆 表示向置 c 的转置 . /3的最小二乘估 
计以及与之相关的协方差矩阵的估计分别为 

- rp « 一 1 rp • rp 一 1 

P Cov (/3) = al ^ x t x [ ， 

• i=l . 

其中 4 是的方差，可以用回归残差的方差来估计.当存在序列相关性或条件异 
方差性时，前面的协方差阵估计不再是相合的，这经常会导致為的比偏大. 
White (1980) 的估计是 

(2.49) 


Cov(^0hc 


^2 XtX，t 


-^2cfx t x[ 


Y, XtX， t 
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其中 h = Vt - x [白是 t 时刻的残差. Newey 和 West(1987) 给出的估计是 


其中 



• r 

—l 

- T - 

Cov ( 泠 ) HAC — 


亡 HAC 

.t=\ - 


(2.50) 


T I T 

亡 HAC = ^2^x t x[ 

t=i j=i t=i+i 


这里 / 是截断参数， 4 是权重函数，例如它可以是如下定义的 Bartlett 权重函数 


也可以用其他的权重 函数. Newey 和 West 建议/取 4(T/100) 2 / 9 的整部.该估计本 
质上是用非参数的方法来估计的协方差阵. 

作为说明，我们在 (2.45) 式用利率的一阶差分序列.如果忽略残差中的序 
列相关性和异方差性，则 Cl , 系数的/比是 104.63; 如果用 HC 估计的话，该 比 
变为 46.73; 如果用 HAC 估计，则该 f- 比 减少为 40.08. 下面我们用 S-Plua 来演示 
回归的 过程. 考虑到残差的序列相犬性，回归中用了延迟值和 c 3( t _ i 作为回 
归因子. 


S - Plus 演示 


%表示注释. 

> x=matrix(scan(file= / w-gsln36299.txt # ),3) % Load data 

> gsl=x 【 l # 】 % 1-year interest rate 

> gs3-x[2,] % 3-year interest rate 

> dgs3=diff(qs3) 

> dgsl=diff(gsl) 

> reg.fit*OLS(dgs3-dgsl) % Fit a simple linear regression 

> summary(reg.fit) 

Call ： 

OLS(formula = dgs3 - dgsl) 

Residuals ： 

Min IQ Median 3Q Max 

-0.3B06 -0.0334 -0.0005 0.0344 0.4742 

Coefficients ： 

Value Std. Error t value Pr(>|t|) 

(Intercept) 0.0002 0.0015 0.1609 0.8722 

dgsl 0.7811 0.0075 104.6283 0.0000 


Regression Diagnostics : 
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R-Squared 0.8479 
Adjusted R-Squared 0.8478 
Durbin-Watson Stat 1.6158 

> summary (r eg. fit # correct ion= 11 white M ) % Use HC estimator 

Cocfficiento : 

Value Std. Error t value Pr(>|t|) 

(Intercept) 0.0002 0.0015 0.1609 0.8722 

d^Hl 0,7811 0.0167 46.7260 0.0000 

> summary(reg•fit # correction= n nw n ) % Use HAC estimator 

Coefficients : 

Value Std. Error t value Pr(>|t|) 

(Intercept) 0.0002 0.0017 0.1436 0.8858 

dgsl 0.7811 0.0X95 40.0841 0.0000 

% Below, fit a regression model with time series error 

> reg• ts=OLS (dgs3_dgsl+t:slag (dgsJ # l) +tslag (dgsl ,1) # na. rm=T) 

> summary(reg.ts) 

Call ： 

OLS(formula * dgs3-dgsi-ft:slag(dgs3 # X) -t-talag (dgsl, 1) , na.zm * T) 
Residuals: 

Min XQ Median 3Q Max 

-0.3652 -0.0329 -0.0005 0.0333 0.4506 


Coefficients ： 


(Intercept) 
dgsl 

tslag(dgs3, 1) 
tsiag(dgsl # 1) 


value Std. Error 


0.0002 0.0015 

0.7851 0.0078 

0,1920 0.0221 

-0.1634 0.0190 


Regression Diagnostics : 

R-Squared C.8537 
Adjusted R-Squared 0.8535 
Durbin-Watson Stat 1.9740 


t value Pr(>|tI) 
0.1426 0.8866 

100.4694 0.0000 

8.6685 0.0000 

-8.6219 0.0000 


2.11 长记忆模型 

我们已经讨论过，平稳序列的 ACF 在间隔增加时呈指数速度衰减.但是，对 
单位根非平稳时间序列.可以 证明： 对任意固定的间隔，当样本容量增加时.样本 
ACF 收敛于 1( 见 Chan 和 Wei (1988) 以及 Tiao 和 Tsay (1983)). 有些时间序列的 
ACF 随间隔的增加以多项式的速度缓慢衰减到（)，这样的过程称为长记忆时间序 
列.长记忆序列的一个例子就是如下定义的分数差分序列： 

(1 一 B) d xt = a u -0.5 <d< 0.5, (2.51) 
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其中是一个白噪声序列.模型 (2.51) 的性质已在文献中得到广泛的研究（如 
Hosking (1981)). 我们把它的一些性质综述如下. 

(1) 若 d < 0.5 ，则而 是弱平稳过程并有无穷阶 MA 表示： 

OO 

it = q t + tpiat-i, 


其中 


( 2 ) 


, 一 d (1 + d) •. ， （ifc — 1 + d) (fc 十 d — 1)! 

• = ki = k\ {d - 1 )!. 

若 rf > -0.5, 则; r t 是可逆的并有无穷阶 AK 表示： 


x t 


7TiX 卜 i + dt ， 


其中 


丌 it 


-d (1 — ci ) • • • (k — 1 — ci ) 
jfc ! 


(3) 对 -0.5 < d < 0.5, 3：< 的 ACF 为 


( k - d - l )\ 
*!(_,£_ 1)1 


= d(l + rf )---( fe-l + d ) 
Pk = (1 - d ) (2 - d ) - ( k - d )' 

特别地，灼 一 々 （1 - d )， 且当 fc - oo 时 


Pk « 


(- rf ) l ，2 d-l 
(d—i)! 


(4) 对 —0.5 < d < 0.5, it 的偏自相关函数 （ PACF ) 为如, fc = dj (k - d ), 

fc —1,2, 

(5) 对 -0.5 < d < 0.5, 的谱密度函数 / ( w )( 它是: r t 的 ACF 的傅里叶变换） 

满足 

/ ( o ;) 〜 uT 2d ，w — 0， (2.52) 

其中 we [ OJM 表不频率. 

当 rf < 0.5 时，我们对 A 的 ACF 的性质特别感兴趣.这条性质表明办〜 
ck 2d ~\ 以多项式速度衰减,而不以指数速度衰减.正因为这个原因，这样的: r t 过 
程称为长记忆时间序列. (2.52) 式中谱密度的特殊特征是当时谱发散到无 
穷，而平稳 ARMA 过程的谱密度函数对 w e [0,2 ji ] 是有界的. 

前面我们用到了非整数幂的二项式 展开： 


(1-丑，=^>1)*(:)护， 


(d \ d(d- l)..(d_fc 十 1) 

U J =, 
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若分数差分序列 （1 - B ) d x t 服从一个 ARMA ( p ， g ) 模型.则称: r f 为一个 ARFIMA 
( p ， d , g ) 过程，它是 ARIMA 模型的推广，这里允许 d 为非整数. 

在实际中.如果-•个时间序列的样本 ACF 在数值上不大，但衰减得很慢，则该 
序列就可能会有长记忆性.作为说明，图 2-22 所示的是1962年7月3日至1997 
年12月31日的 CR 5 P 价值加权指数和等权重指数的日简单收益率的绝对值序列 
的样本 ACF 值. 可见 ACF 的数值相对较小，但衰减很慢.甚至在间隔为300以后 
还在5%的水平下是显著的.对绝对值收益率序列的样本 ACF 的表现,更多的讨论 


(») 



间隔 

图 2-22 CRSP 价值加权指数和等权重指数的日简单收益率的绝对值序列的样本 ACF ： 
( a ) 价值加权指数收益率的绝对值序列的 ACF ； ( b ) 等权重指数收益率的绝对值序 
列的 ACF . 时间区间是从1962年7月3日到1997年12月31日 

参见 Ding , Granger 和 Engl e (1993) .对 (2.51) 式中的纯分数差分模型，我们可以用 
最大似然法或带低频对数周期图的回归方法来估计 rf . 长记忆模型在金融文献中受 
到关注，部分的原因是在连续时间模型中关于分形布朗运动的工作. 


附录 一些 SCA 的命令 

2.4 节中使用的命令 

数据文件是 m - vw . txt ， 符号“一”后为注释，这些注释解释的是每个命令的功 

一 load data Into SCA and denote the series by vw. 
input, vw. file # m-vw. txt 9 


用‘ 
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— compute 10 lags oE PACF* 
pacf vw. maxi 10. 

•- compute AIC for AR(1) to AR(10)• 
miden vw. no com. arfits 1 to 10. 

--specify an AR(3) nodel and denote the model by ml. 
tsm ml. model (1 # 2,3) vw-cO-fnoise. 

--estimate the model and store the residuals in rl. 
estim ml. hold resi(rl) 

--cutnpuLe ACF ol Lhe xebidual^ # includiny Q sLctL 丄 « 
acf rl, 

--refine the model to an AR(5)• 
tsm ml. model (1,2,3,4,5)vw=cO+noise. 

- estimate the model and store the recidualo in rl. 
estim ml. hold resi(rl) 

--compute ACF of the residuals, 
acf rl. maxi 10. 

--compute p value of the Q(5) statiotic. 
p-1.0-cdfc{11.2 # 5) 

— print p-value. 
print p 

--re-estimate the nodel using the first 858 observations. 
estira ml. span 1,858. 

--compute 1-step to 6 - step ahead forecasts at origin 858. 
ufore ml• orig 858. nofs 6. 

--quit SCA. 
stop 

2.9 节中使用的命令 

一年期限利率在文件 “wgslyr.txt” 中，三年期利率在文件 〜 g S 3yr. txt” 中 . 

一 load data into SCA, denote the data by ratel and rate3. 
input date, ratel. file "wgslyr.txt" 

input date,rate3. file r wgs3yr.txt # 

— specify a simple linear regression model. 
tsm ml. model reite3»b0 十 (bl) ratel+noise . 

--estimate the specified model and store residual in rl. 
estim ml. hold resi(rl). 

--compute 10 lags of residual acf. 
acf rl. maxi 10• 

- -difference the series & denote the new ones by clt and c3t 
diff old ratel,rate3• new clt, c3t. compress. 

—specify a linear regression model for the differenced data 
tsm m2, model c3t=h0+<hl}clt+noise• 

--estimation 

estim m2 • hold resi(r2). 

—— compute residual acf. 


acf r2. maxi 10• 





― specify a regression model with time series errors. 
tsm m3. model c3t=g0+(gl)clL+(1)noise. 

--estimate the model using the exact likelihood method , 
estim m 3, method exact . hold resi ( r 3). 

— compute residual acf. 
acf r3. maxi 10. 

•• refine the model to include more MA lags . 
tsm m 4. model c 3 t = g 0+< gl ) clt +(1,4,6> noise • 

--estimation 

estim m 4. method exact . hold reel ( r 4). 

--compute residual acf , 
acf r4. maxi 10. 

--exit SCA 
stop 

练习题 

除非特别声明，在以下习题中都用5%的显著性水平来得出结论. 

2.1 假定一个愤券指数的月简单收益率服从如下 MA (1) 模型： 

Ht = o « + 0.2 at _ i , a a = 0.025. 

假设 a,oo = 0.01. 计算该收益率以 6 = 100 为预测原点的向前 1 步和向前2步的预测. 
预测误差的标准差分别是多少？ 计算该 收益率序列的间隔为1和间隔为2的自相关系数. 
2.2 假定一个证券的日对数收益率服从模铟 

Tt = 0.01 - I - 0.2 rt_a + at , 

其中是均值为0、方差为 0.02 的高斯白噪声序列.收益率序列的均值和方差 
是多少？计算 n 的间隔为1和间隔为2的自相关 系数. 假设 r * l00 = -0.01, r 99 = 0.02 
计算该收益率序列以 t = 100为预测原点的向前1步和向前2步的预测.预测误差的标 
准差分别是多少？ 

2.3 考虑美国从1951年1月到2004年2月的月失业率，数据包含在文件‘ ‘ m - unemhelp . txt " 
屮.数据已经经过季节调整.来自圣 • 路易斯联邦储备银行.为该序列建立一个时间序列 
模型，并用该模型预测2004年3月、4月和5月的失业率.进-•步，如果存在周期环，计 
算其周期.（注意，适合该数据的模型不只一个，只要模型是充分的即可 .） 

2.4 考虑基子市场资本化的纽约证券交易所、美国证券交易所和纳斯达克证券交易所中 Decile 
1 ， Decile 5和 Decile 10的简申月收益率.数据的时间区间是从1960年1月到2003年 
12月，数据来自 CRSP 

( a ) 对每个收益序列.在5%的显著性水平下检验如下原假设 ：前〗 2个间隔的自相关系 
数全为0,并得出结论. 

( b ) 为 Decile 5序列建立 AR 模型和 MA 模型 • 

( c ) 用所建立的 AR 模型和 MA 模型对序列进行向前1步到向前3步预测. 

2.5 考虑 IBM 股票从1962年到2002年的日简单收益率，数据包含在文件‘ , d - ibmvwew 6202. 
txt " 中.计算 IBM 股票日简单收益率绝对值序列的前100个间隔的样本 ACF . 存在长 
范围相依的证据吗？为什么？ 
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2.6 考虑美国制造业的用电需求.数据是取对数后的，表示每个月中固定某天的需求,包含在 
数据文件 " power 6. txt " 中. 对序列建立时间序列模型，并用所拟合的模型进行向前 i 
步到向前24步预测. 

2.7 再考虑 CRSP 等权重指数（包含分布）从198(】年1月到1999年12月的日简单收益率， 
数据包含在文件‘ ‘ d - ew 8 099. txt * * 中.代表星期一、星期二、星期三和星期四的指示变最 
存储在文件‘ ‘ wkdaysSOM . txt ，* 的前 四列. 用一个回归模型来研究指数收益率的交易日 
效攸.所拟合的模型是什么？对于该序列，周末效成在5%的显著性水 Y F 显著吗？用协方 
差阵的 HAC 估 U 米(1 算;！3归估计的 <-比.这会改变周木效应检验的结论吗？残差中存 
在序列相犬性吗？如采存在序列相关性，建立带时间序列误差的模型来研究周末效应. 

2.8 由上一个练习知等权重指数的日收益率 存在一 些周末效应，那么 S&P500 综合指数存在 
周末效应吗？为回答该问题，考虑从 2000 年 1 月 3 日到 2003 年 12 月 31 日的 S&P500 
综合指数的日收益率，教据包含在文件 “d-da11 3 dx0003.txt” 中，该文件有 12 列. 前四 
列分别是 Dell, vw, ew. 和 sp 的日收益率，第 5 〜 9 列分别是周一到周五的指示变量第 
10〜12列分别表示年、月、日.共有1 004个数据点.所有的检验都在5%的显著性水平 
下进行，回答下述 问题： 

( a ) S & P 500 综合指数的日简单收益率存在星期五效应吗？你可以用一个简单的线性回归 
模型来回答该问题.估计模型，并检验不存在星期五效应的原假设.得出你的结论. 

( b ) 用 Q (12) 统讣量来检验残差的序列相关性.残差中存在显著的序列相关性吗？ 

2.9 对单个股票收益率考虑与上题中类似的 问题. 在该题中，我们采用 Dell 股票的日简单收益 
率. 

( a ) Dell 股票的日簡单收益率存在星期五效应吗？估计模型，并检验不存在星期五效应的 
原假设，得出你的结论. 

(^)残差中存在序列相关性吗？用 Q (12) 统计量进行检验，并得出你的结论. 

( c ) 用带时间序列误差的回！ tl 模型对上述模型进行改进.基于改进后的模型，存在显著的 
星期五效应吗？ 

2.10 考虑穆迪公司发售的 AAA 和 BAA 优质债券从1919年1月到2004年3月的毎月盈 
利.数据来自圣.路易斯联邦储备银行.月盈利是日盈利的平均值.计算这两个收益举序 
列的概括性统计最（样本均侑，样本标准差.样本斜度.样本超额峰度，最大值、 敁小 值). 
债券盈利是偏斜的吗？它们是厚尾的吗？在5%的显著忡水平下冋答这些问题 
2.11 考虑练习 2.10 中的 AAA 债券月盈利.为该序列建立一个时间序列椹沏. 

212仍然考虑两个愤券序列，即 AAA 和 BAA . 这两个序列之间有什么关系？为回答该问题, 
把 AAA 债券的盈利作为因变量，而 BAA 债券的盈利作为自变量来建立时间序列模型. 
2.13 考虑 CRSP 等权重指数的月对数收益率，从 196 2 年1月到1999年12月共456个观察 
值-你可以直接从 CRSP 或在网上文件 ‘‘ m - ew 6299. txt * •中得到数据. 

( a ) 给该序列建立一个 AR 模型，并检验所拟合的模型. 

( b ) 给该序列建立一个 MA 模型，并检验所拟合的模型 • 

( c ) 用前两问中所建的 API 和 MA 模型计算向前1步和2歩预测. 

( d ) 比较所拟合的 AR 和 MA 模型. 

2.14 考虑 S&P500 指数的现价与期货价的动态犬系•数据 文件" S p 5may . da t ，， 有 三列： 期货 
价的对数.现价的对数和交易成本 （ C ost- o f- C Qrry)(xl00). 数据是来自芝加哥商品交易所 
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(Chicago Mercantilo Rxrhangp) 的 1993 年 5 月的 S&P500 指数及其 U 月的期货合约. 
时间间隔为1分钟（一天 内). 有些作者利用此数据来研究指数期货的套利机会这里我们 
把注意力放在前两 列上. 设/,和办分别是期货价和现价的对数.考虑 y , - 和 
设 y t 为因变量，建立{讲}和{ X ,}间带时间序列误差的回归模型. 

2.15 每季度国民生产总值的隐性通货紧缩抱数 （gross domestic product implicit price defla ¬ 
tor ) 通常用来度量通货 膨胀. 文件 Hq-gdpdef.dat’ ， 包含了美国从1947年第一季度到 
2004年第一季度的此数据.数据格式是年、月和通货紧缩指数.该数据是经过季节性调整 
的， 20()0 年时的数值为 U )0. 对该序列建立一个 ARIMA 模型，并检验所拟合的模型的有 
效性.数据是从圣 • 路易斯联邦储备银仃得到的. 
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第 3 章条件异方差模型 

本章的日标是研究一些在文献中用来给资产收益率的波动率建模的统计方法 
和计量经济模型.称这些模型为条件异方差模型. 

波动率在期权交易中是一个重要因素，它是标的资产收益率的条件标准差.例 
如，考虑一个欧式看涨期权的价格.欧式看涨期权是一个合同，它给持有者一个权 
利，可以在将米给定日期以固定的价格购买固定数量的一个具体股票的股份.持 
有者在对自己不利的情况可以不执行购买.这个固定的价格叫做敲定价格 (strike 
price ), 通常记为欠.给定的日期叫做到期日.这里重要的是距离到期日的时间长 
度，记为 Z . 著名的 Black - Sdxoles 期权定价公式表明一个欧式看涨期权的价格是 

ct = P t ^ ( a :) - Kr ~ 1 ^ [ x -< r t Vl ^ , x = (3.1) 

其中巧是标的股票的现价, r * 是无风险利率，是该股票对数收益率的条件标准 
差， $( x ) 是标准正态随机变量的累积分布函数在: r 点的值.此公式的推导将在第 
6章给出.对这个公式有几个精彩的解释，但在这里只要明白标的资产对数收益率 
的条件标准差 q 在其中起重要作用这一点就够了.这个波动率随时间变化，并且 
将是本章主要讨论的问题.如果持有人能在到期日或者在到期日之前任何时刻执行 
他的权利，那么这种期权叫做美式看涨期权. 

波动率在许多其他金融方面也有应用.如第 7 章的讨论,波动率的建模提供了 
一个简单方法来计算风险管理中一个金融头寸的风险值.对于均值方差框架下的 
资产配置，波动率也起了重要作用进一步,一个时间序列波动芊的建模能改进参 
数估计的有效性和区间预测的精确度.最后，市场的波动率指数最近己经成为一种 
金融工具.由芝加哥期权交易所 （Chicago Board of Option Exchange , CDOE ) 编制 
的 VIX 波动率指数己经于2004年3月26日进行期货交易. 

本章讨论的一元波动率模型包括 Engle (1982) 提出的自回归条件异方差 （ au ¬ 
toregressive conditional heteroscedastic , ARCH ) 模型， BoIIerslev (1986) 提出的推 
广的自回归条件异方差模型 （ GARCH )， Nelson (1991) 提出的指数 GAHCH 模型 
( EGAKCH ), Tsay (1987) 提出的条件异方差自回归滑动平均 （ CHARMA ) 模型, 
NichoUs 和 Quinn (1982) 提出的随机系数自回归 （ RCA ) 模型， Melino 和 Turn - 
bull (1990), Taylor (1994), Harvey , Ruiz 和 Shephard (1994), 以及 Jacquier , Poison 和 
Rossi (1994) 分别提出的随机波动率 (Stochastic Volatility , SV ) 模型.我们还讨论了 
各个波动率模型的优点和缺点，并给出这些模型的一些应用.多元波动率模型，包 
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括那些具有时变相关系数的模型，将在第10章中讨论.本章还在 3.15 节讨论了波 
动率建模的一些其他方法.包括应用某项资产的最高价格和最低价格. 

3.1 波动率的特征 

股栗波动率的一个特殊性是它不能被直接 观测. 例如，考虑 IBM 股票的日对 
数收益率.因为一个交易日只有一个观测值，所以日波动率不能从收益率中观测出 
来.如果可以得到天内的股票数据，如 1() 分钟的收益率，那么我们可估计日波动 
率，参见 3.15 节.然而这种估计的准确性值得仃细研究.例如，股栗波动率包括交 
易曰内波动率和隔夜波动率，而后者代表不同交易日之间的变化.高频交易日内收 
益率只包含隔夜波动率很有限的信息.波动率的不可观测性给评价条件异方差模型 
的预测表现带来了困难.我们将在后面章廿中讨论这一问题. 

在期权市场上，如果我们接受这样一个 思想： 期权的价格是由如 Black-Scholes 
公式这样的计童经济模型决定的，那么我们就可以利用期权的价格得到隐含波动率 
(implied volatility ). 这种方法往往遭到批评，因为使用的具体模型，要基于一些实 
际可能不成立的假定.例如，由一个欧式看涨期权的价格，我们能利用 （3.1) 式的 
Black - Scholes 公式推导出条件标准差 tr t ， 所得到的值称为标的股票的隐含波动率. 
然而，这个隐含波动率是在假定标的资产的价格服从几何布朗运动时得到的，它可 
能与实际的波动率很不一样.经验告诉我们，隐含波动率一般要比采用 GARCH 类 
波动率模型得到的值大.这也许是与波动率的风险溢价或计算日收益率的方法有 
关.芝加哥期权交易所的 VIX 波动率指数是隐含波动率指数. 

虽然波动率不可直接观测，但它的一些特征在资产收益率序列中能普遍看到. 
第一，存在波动率聚集 （volatility cluster) ,也就是，波动宇可能是在一些时间段 
上高，而在另一些时间段上低.第二，波动率以连续方式随时间变化，即波动率跳跃 
是很少见的.第二，波动率不发散到无穷，即波动率在固定的范围内变化.从统计 
学角度说，这意味着波动率往往是平稳的.第四，波动率对价格大幅上 T 1 和价格大 
幅下降的反应不同，这种现象称为杠杆效应 (leverage effect). 这些性质对波动率 
模型的发展起着重要作用.一些波动率 模型主 要具体针对已有模型在刻画上述这 
些特征上的弱点而提出的.例如， EGAKCH 模型就是为了刻画波动率对大的“正” 
和“负”资产收益率的不对称性而提出来的. 

3.2 模型的结构 

用 r * t 表示某项资产在 < 时刻的对数收益率.波动率研究的基本思想是，序列 
{ r t } 是序列不相关的或低阶序列相关的，但不是独 立的. 作为说明，图 3- i 给出了 
Intel 公司股票从1973年1月到2003年12月的月对数收益率的自相关函数 ( ACF ) 
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和偏自相关函数 （ PACF ). 图 lla 是收益率的样本 ACF , 显示除了在滞后为7时有 
较小相关性之外没有显著的序列相关性.图 Me 是对数收益率的绝对值序列 hi 
的样本 ACF , 而图 3- lb 是收益率平方 rf 的样本 ACF , 这两幅图清楚地表明月收 
益率序列不是独立的.结合上述三个图形，收益率序列看起来像是序列不相关的且 
不是独立的.波动率模型就试图去刻画收益率序列的这种不独立性. 


( a ) 对数收益率 




(0 绝对值化的对数收益率 
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( b ) 乎方了的对败收益率 
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( d ) 平方了的对败收益率 
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图 3*1 Intel 公司股票从1973年1月到2003年 
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月的月对数收益率的样本自相关函数和 


样本偏自相关函数： （ a ) 对数收益率的样本 ACF ; ( b ) 收益率平方 r ? 的 ACF ; ( c ) 对 
数收益率的绝对值序列 |7 t | 的样本 ACF , ( d ) 收益串 f 方的 PACF 


为了把波动率模型放在一个合理的框架中，考虑给定 < - 1时刻已知的信息集 
巧 ^时 r t 的条件均值和条件方差 

= Ay) ， of = Var ( r t | F t _ t ) = E [( r , - ^) 2 l ^- i ] (3-2) 

是有益的.特别地，信息集包含过去收益率的一切线性函数.第2章中的实 
例和图34 表明： 股票收益率序列即使有序列相关性的话也很弱.因此 （3.2) 式 
中关于^的等式应是较简单的.我们假定服从一个简单的时间序列模型，如带 
解释变量的平稳 ARMA { p iq ) 模型.换句话说,对于我们接受模型 

k p q 

n = A*/ + /^e = 0o + ^ iXit + 5Z 一 卜 “ (3.3) 

i=l »=1 «=1 

其中可 fc ， p 和 g 是非负整数，:是解释变量. 

模型 (3.3) 给出了第 2 章中线性时间序列模型在金融中的可能应用. ARMA 
模型的阶 ( p ,(?) 可能取决于收益率序列的频率.例如.股票市场指数的日收益率往 
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往有较小的序列相关性，但指数月收益率可能就没有任何显著的序列相关性.模型 
(3.3) 中的解释 变量以 比较灵活.例如对星期一这天设计一个••哑变量' (dummy 
variable) 来研究股票日收益率的周末效应 (the effect of weekend). 在资本资产 
定价模型 （CAPM) 中，的均值方程可以写为 r t = 0o + 所 w + ot， 其中 r m , t 代表 
市场组合的收益率. 

结合 (3.2) 式和 （3.3) 式，我们有 

a2 = Vm (r t \ F t - i ) = Var (o* |尸卜1 ). (3.4) 

本章的条件异方差模型就是用来描述 4 的演变的 . 4随时间变化的方式可以用 
不同的波动率模型来表示. 

条件异方差模型可分为 两类： 第一类是用确定的函数来刻画 W 的 演变； 第二 
类是用随机方程来描述 GARCH 模型属于第一类，而随机波动率模型属于第 

二类. 

本书把称为资产收益率在 t 时刻的“扰动”或“新息”. <r t 为4的正平方 
根. (3.3) 式中叫 的模型称为 r t 的均值方程，4的模型称为 r t 的波动率方程.因 
此，条件异方差性建模就是对时间序列模型增加个动态方程，来刻画资产收益率 
的条件方差随时间的演变规律. 

3.3 建 模 

对资产收益率序列建立一个波动率模型需要如下4个步骤. 

(1) 通过检验数据的序列相关性建立一个均值力程，如有必要，对收益率序列 
建立一个计量经济模型（如 ARMA 模型）来消除任何的线性依赖. 

(2) 对均值方程的残差进行 ARCH 效应检验. 

(3) 如果 ARCH 效应在统计上是显著的，则指定一个波动率模型，并对均值方 
程和波动率方程进行联合估计. 

(4) 仔细地检验所拟合的模型.如有必要则对其进行改进. 

对大部分资产收益率序列,如果有序列相关性的话,也很弱.因此，如果样本均 
值显著的不为零的话，建立均值方程就等于从数据中移除样本均值.对于某些日收 
益率序列，建立一个简单的 AR 模型是必要的.在某些情形下，均值方程可能要用 
到解释变量，比如为解释周末效应或一月效应而引进的指示变量. 

在下文中，实证分析用的软件是 S-Plus. 其他的一些的软件包也可能用到，例 
如 Eviews, SCA, R 以及 RATS 等. 

ARCII 效应的检验 

为了符号上的方便， id a t = r t -tH 为均值方程的残差，则可以用平方序列< 
来检验条件异方差性，即所谓的 ARCH 效应.有两个检验可以用.第一个检验是将 
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通常的 Ljung - Box 统计量 { Q ( m )} 应用于序列 { a ?}, 参见 Mcleod 和 Li (1983) .该 
检验的原假设是 {« D 序列前 m 个间隔的 ACF 值都为零.第二个对条件异方差的 
检验是 Engle (1982) 的拉格朗日乘子检验.该检验等价于在如下线性回归中用 F 
统计量检验 a * = 0(« = 1, • • • , m )： 

aj = cto c »\ ci ' i-i + ... + t = m + l ，..- , T , 

其中表示误差项， m 是事先指定的正整数 ，7 1 是样本 容量. 具体地^原假设是 
Hq : =…= at m = 0•令 SSRq = 52 ( a ? - U ) 2 , 其中 G 7 = (1/ T ) a t 是 a ? 

t = m-f I t=l 

的样本均值，并且 55 H , = E el 其中& 是前面线性回归最小二乘估计的残差. 
于是在原假设下，我们有 ’一 1 


(SSRq- 55/20/m 
= S3Ri/{T-2m-iy 

它渐近服从自由度为 m 的 x 2 分布.决策规 则是： 如果 F > xM 或 F 的 p 值小 
于 a , 则拒绝原假设.这里 ⑷是 3 d 的上 100(1- a ) 分位点. 

为通过例子说明上述理论，下面考虑 Intel 公司股票从1973年到2003年的月 
对数收益率,参见下面的例 3.1. 序列没有显著的序列相关性，因此可以直接来检验 
ARCH 效应.事实上，序列的 Q{m) 统计量给出 Q (12) = 18.57, p 值为0.10,进一 
步确认了数据没有序列相关性.另一方面，拉格朗日乘子检验给出检验统计量值为 
43.5, v 值靠近零，这表明有很强的 ARCH 效应. 

S - Plus 演示 

将收益串序列记为 intc. 注意到命令 archTest 直接应用于序列 at, 而不是 

> autocorTest(into,lag=12) 

Test for Autocorrelation : Ljung-Box 
Null Hypothesis ： no autocorrelation 

Teat Statistics : 

Test Stat 18.5664 p.value 0.0995 

Dist. under Null ： chi-square with 12 degrees of freedom 
Total Observ .； 372 

> archTest(intc, lag=12) 

Test for ARCH Ettects ： LM Test 

Null Hypothesis : no ARCH effects 

Test Statistics: 

Test SLat 43.5041 p.value 0.0000 

Dist. under Nulls chi-square with 12 degrees of freedom 
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3.4 ARCH 模型 

给波动率建模提供一个系统框架的第一个模型是 Engle(1982) 提出的 ARCH 
模型. ARCH 模型的基本思想是 ： （a) 资产收益率的扰动^是序列不相关的，但不 
是独 立的； （b) a t 的不独立性可以用其延迟值的简单二次函数来描述.具体地说，一 
个 ARCH(m) 模型是假定 

a t = crtEu of = a 0 + aiaf.j +... + (3.5) 

其中悻是均值为0、方差为 1 的独立同分布 （ iid ) 随机变量序列， cv 0 > 0,对 i > 0 
有％ > 0. 系数…必须满足一些正则性条件以保证 a t 的无条件方差是有限的.实 
际中，通常假定^服从标准正态分布,标准化的学生 t - 分布,或广义误差分布. 

从模型的结构上看，大的过去的平方“扰动” 会导致新息的大的 

条件方差从而 ，叫 有取绝对值较大的值的倾向.这意杂着，在 ARCH 的框架下, 
大的“扰动”会倾向于紧接着出现另一个大的“扰动”.这里用•‘倾向”这个词，是 
因为大的方差不一定意味着大的实现值，它只表明是大方差发生的概率比小方差情 
形要大.这与在资产收益率中所观察到的“波动率聚集 ” (Volatility clustering ) 现象 
相似_ 

ARCH 效应也出现在其他金融时间序列中.图 3-2 a 显示了 1989年6月5 
日至1989年6月19日每10分钟间隔观察的德国马克对美元的汇率的百分比 
变化量的时间图 3-2 b 显示的是这个百分比变化量的平方所构成的序列的时间图. 
变化置的大的百分比时有发生，但存在某种稳定的周期.图 3-3 a 显示的是这个百 
分比变化量序列的样本自相关函数.它淸楚地表明该序列没有序列相关性.图 3-3 b 


( a ) 汇率中的百分比变化 
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图 3*2 ( a ) 1989年6月5日至1989年6月19日每10分钟间隔的 
德国马克对美元汇率的收 益率； （ b ) 该收益率的平方 
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一 ■ I , - 1 -- I 
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间隔 

图 3*3 ( h ) 德国马克对美元的汇率收益率序列的样本自相关 函数； 

(b) 平方收益率序列的样本偏自相关函数 

是变化量的百分比序列的平方所构成的序列的样本偏自相关函数，可见这个函数有 
一些大的值，这表明该序列不是独立的，并且有所谓的 ARCH 效应. 

注释有些作者把 (35) 式中的条件方差表示为这时 “ 扰动”变成 = 
y / fh £ t ^ □ 

3.4.1 ARCH 模型的性质 

为了理解 ARCH 模型的含义,我们来仔细研究一下 ARCH ⑴ 模型： 
a t = a t £ t , of + 

其中砌 > 0, a , ^ 0. 首先，％的无条件均值仍是0,因为 

E ( a t ) = E [ E ( a t \ F t . x )] - E [ a t E ( e t )] = 0. 

其次, a , 的无条件方差是 

Var (a t ) = E ( a ^) = E [E ( a ^ )] = E [a 。 十 ‘ cto 十 cnE . 

因为是平稳过程且 E ( a t ) = 0, 所以 Var ( a t ) = Var ( a t _ i ) = E ( a «_ i )- 从而，我 
们有 Var (« t ) = « 0 + « 1 Var ( a *) 1 即 Var ( a t ) = - Q ° . 因为的方差必须为正的, 

1 — ai 

我们需要条件0 彡叫 < 1. 最后，在一些应用中，我们 需要叫 更卨阶的矩存在，从 
而叫还需满足另外的约來 条件. 例如， 为研究 a t 的尾部性质，我们要求的四阶 
矩是有限的.在 (3.5) 式中假定^服从正态分布，则有 

E ( a ； |朽 a )=3[ E ( a ? } F t ^)] 2 = 3 ( a 0 4- 




_(b) 


IN 


1005,n10 

o. ().n u. 
JOV 


cuovd 


因此 
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E W) = E [E (aj IFt-i)] = 3E(ao4- aiaj.^ 2 = 3E [aj + 2« 0 «10^_! + afofj . 


若〜是四阶平稳的且记 m 4 = E W), 则我们有 
rri4 = 3 [ao + 2a 0 aiVar (a t ) + ckf 1714] = 3 a ^ 



从而 


3ag(l +ai) 
(l- Ql )(l-3a?)* 


这个结果有两个重要含义 ：（a) 因为 a t 的四阶矩是正的. 所以叫 必须满足 l-3af > 
0,即0 < a? < ^ (b) a t 的无条件峰度是 


E K) 0 岣 U + ai) (1-ai) 2 _ 0 l~a?. 

[Var(ai)] 2 ' (l-a!)(l-3af) ~~^ - ^ 

这样 1 〜的超额峰度是正的，并且 a t 的分布的尾部比正态分布的尾部要厚.换句 
话说，服从条件高斯的 ARCH ⑴模型的“扰动比高斯白噪声序列更容易产生 
“异常值 ”( OU tli er3 ), 这与实证结果相 一致. 实证结果也表明资产收益率中出现“异 
常值”的时候要比独立同分布的正态随机变量序列出现“异常值”的时候多. 

这些性质对一般的 ARCH 模型仍成立，但对高阶 ARCH 模型公式会变得更复 
杂一些. (3.5) 式中条件 ai ^ i ) 能放松，这是一个保证条件方差 a t 2 对所有的 i 取正 
值的 条件. 亊实上，使条件方差取正值的一个自然方式是把 ARCH(m) 模型改写成 


a t = Oie ty a? = a 0 + (3.6) 

其中 Am,t := ( 屯 i ，… ，叫 _ m y, 是一个 m xm 阶的非负定矩昨. （ 3.5) 式定义 
的 ARCH(m) 模型要求 fl 是对角 阵. 这样， Engle 的模型是用一个非常节省参数的 
方式来逼近一个二次 函数. 实现 （ 3.6) 式的一个简单方法是给 a< —个随机系数模 
型，具体可参见后面章节讨论的 CIIARMA 模型和 RCA 模型. 

3.4.2 ARCH 模型的缺点 

arch 模型有不少优点.包括前一节中讨论的性质.该模型也有一些缺点. 

(1) ARCH 模型假定正的“扰动”和负的“扰动”对波动率有相同的影响，因为 
波动率依赖于过去“扰动”的平方.实际中，众所周知，金融资产的价格对正的和负 
的“扰动”的反应是不同的. 

(2) ARCH 模型对参数的限制相当强.比如，若序列有有限的四阶矩，则 ARCH ⑴ 
中的 a? 必须在区间中.对高阶的 ARCH 模型，这种约束会变得更复杂.在 
实际中，这就限制了带髙斯新息的 ARCH 模型更好地刻画超额峰度. 
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(3) 对于弄淸一个金融时间序列的变化的来源， ARCH 模型不能提供任何新见 
解.它只是提供一个机械的方式来描述条件方差的行为，而对由什么引起这种行为 
却没有给出任何启示. 

(4) ARCH 模型给出的波动率预报值会偏高，因为它对收益率序列大的孤立的 
“扰动”反应缓慢. 

3.4.3 ARCH 模型的建立 

在所有的波动率模型中，建立个 ARCH 模型相对来说是比较简单的.下面 
给山其建模的细节. 

阶的确定 


如果通过检验发现存在显著的 ARCH 效应，则可以用4的偏自相关函数 
( PACF ) 来确定 ARCH 模型的阶.下面我们来说明用4的 PACF 来选择 ARCH 
模型的阶是合理的.从 （3.5) 式定义的模型出发，我们有 

af = ao-l- aiaj.! + …+ a m a?_ TO . 

对给定的样本， a ? 是 W 的无偏估计.囚此，我们期望 a ? 以 m 阶自回归模型的方 
式与 «?_„•••, af _ rn 线性相关.注意到单个的#往往不是疗的有效估计,但它口 J * 
以作为一个近似.在具体确定阶 m 时这个近似将会提供充分的信息. 

从另一角度，定义吼=那么可以证明{吼}是均值为零的不相关序列. 
于是 ARCH 模型变成 


4 = u : 0 十 + . • ♦ + 十印， 

这是 a ? 的 AR ( m ) 形式，但{价}不是独立同分布的序列.由第2章的内容 ： < 的 
PACF 是确定阶 m 的有用 T 具因为 {印}不是同分布的，所以上述模型的最小二 
乘估计是相合的，但不是有效的.当样木容量较小时， a ? 的 PACF 可能不是有效的. 
估计 

在 ARCH 模型的估计中通常用到的似然函数有三个.在正态性的假定下， 
ARCH ( m ) 模型的似然函数为 

/ (°1» * * * ,OT|a) = f (a T \F T -i) f (a T -i |Ft- 2 ) • • • / (am+i H)/(a“... ,a m |a) 

…〜 1 < 

其中 Ot = ( aro,«ii ，《 m)\ /(〜 • •• , o m | at ) ^ ai , … ， a m 的联合概率密度函数. 
因为 , a m | a ) 的精确形式是复杂的，故通常把它从上述似然函数中去掉， 
特别足当样本容里很大时.这就导山了条件似然函数 
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/(Om+i ， _.. ， ar|a ， a 1 ,.. 、 a m )=] 


\/2naf 


exp 


厂 4’ 


其中 W 可以递推地计算.我们把由最大化上式而得到的估计称为正态假设下的条 
件最大似然估计 ( MLE ). 

最大化条件似然函数等价于最大化它的对数，而后者比前者容易处理一些.条 


件对数似然函数是 

, a m ) =二 In (2 n ) - ^ In ( arf ) - i 
因为第一项 In (2 n ) 不包含任何参数，对数似然函数变成 

" Om + i ’...， a T | a ， ai ，...， a m ) =— ^ 111 W ) ^ 


其中 of = ao + + ... + n- m a?_ T „ 可递推地计算 

在有些应用中，假设 e t 服从像标准化的学生分布这样的厚尾分布更合适 
—些. 设随机变量 a 服从自由度为 v 的学生 * 分布.则 y > 2时有 Var ( x „) = 
tV (v - 2 )，我们记 e t = x v /y/v/(v-2). e t 的概率密度函数为 


/(£t|v) = FS^^( 1 + A) 


-(v+D/2 


(3-7) 


其中 r (: r ) 是通常的伽玛函数(即 T ( x ) = 广利用 at = ，我们 
得到 a t 的条件似然函数 


/ (Om+li ••- .flT |a, Am) =] 


r ((” + i )/2) 




(tH 1)/2 


r ( v /2) y /{ v - 2 )n (H [ ( v -2) a t 2 . 


其中 V > 2 , = ( ai ，… , a m ). 我们把由最大化上式得到的估计称为学生分布 


假定下的条件 MLE . 学生-<分布的自由度可以事先给定，也可以和其他参数起 
估计出来，如果亊先给定，它往往是3到 G 之间的一个值. 


如果学生分布的自由度事先给定，那么条件对数似然函数为 


1 (° 一 ’ …’叶 |«’ 4 E ln P I (v ~2)~^) + I ln ( a ’)] • ( 3 . 8 ) 

如果想把 t ； 和其他参数起估汁出来，那么包含自由度的对数似然函数为 

“Om+i，... ,or |a, v,i4 m ) = (T - m) [In(r((v + 1)/2)) 

-In (r («/2))-0.51n(( V -2)n)] + / (a m+lt ... ， a；r |« ，乂 m ) ， 
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其中第二项由 (3.8) 式给出. 

最后可以假定&服从广义误差分布 ( GED ), 其密度函数是 


t;exp(-i|x/A| t, ) 

A . 2 d-i/ V ) r ( 1 / u ) > 


fix ) 

其中 r (.) 是通常的伽玛函数，且 


-00 


0 < v < 


(3-9) 


A = [2(_ 2 / w )r(l/t;)/r(3/v) 】 V : 


如果 v = 2,则 GED 分布退化为高斯 分布； 如果 v < 2,则 GED 分布具有厚的尾 
部.可以很容易得到条件对数似然函数 \ ac , Am ). 

模型的 


对一个正确指定的 ARCH 模型，标准化的残差 



是一列独立同分布的随机变量序列.因此，我们可通过检査序列{^}来检验所拟 
合的 ARCH 模型的充分性.特别地，屯的 Ljung - Box 统计星可用来检验均值方程 
的充分性，苟的 Ljung - Box 统计量可用来检验波动率方程的正确性 .{ at } 的偏度、 
峰度、分位点对分位点图 （ qci 图）可用米检验分布假定的正确性. S - Flus 中提供 
了许多用来检验模型充分性的残差图. 

预测 

由 (3.5) 式定义的 ARCH 模型的预测可类似于 AR 模型一样递推地得到.考 
虑一个 ARCH ( m ) 模型.从预测原点 h 出发,的向前一步预测为 

< tJ (1) = Q!o + aiaj + . • • + a m aj +1 _ m . 


向前两步预测为 


a h ( 2 ) = «o + otial (1) H a 2 a\ h • • • + 灵 + 2 —m ， 

a 2 h + l 的向前 Z 步预测为 

m 

Oh (0 = ao + 5 Z - *). (3.10) 

t=l 

其中，若 f - i < 0, 则 4 (f — i ) = 

3.4.4 —些例子 

本节通过两个例子来说明 ARCH 模型的建模. 
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例 3.1 我们首先应用建模方法来给 Intel 公司股票的月对数收益率建立一个简单 
的 ARCH 模型•图中收益率平方序列的 ACF 和 PACF 清楚地表明了条件异方 
差性的存在 • 3.3 节给出的 ARCH 效应检验进一步证实了条件异方差性的存在.接 
下来我们要做的是识别 ARCH 模型 的阶图 3- ld 中的样本 PACF 表明 ARCH (3) 
模型可能是合适的，因此下面将对 Intel 股票的月对数收益率具体建立一个如下形 
式的 模型： 

r t = a t = a t £t t of = a 0 + aia}_ 1 4 - ot 2 at_ 2 + a 3 <^_ 3 . 

假定 ^ 是独立同分布的标准正态序列，我们得到的拟合模型为 

r t = 0.017 1 + a t , of = 0.012 0 + 0.178 7 a?_ x - f -0.077 2 a ?_ 2 + 0.057 2 a ?_ 3 , 

各个参数估计值的标准误差分别是 0.006 6, 0.001 1, 0.080 3, 0.050 6和 0.07 G 9,参 
见下面的输出 结果. 尽管估计值满足 ARCH (3) 模型的一般条件，然而 U 2 和 a3 的 
估计值在5%的水平下不是统计显著的，因此模型可以简化. 

S-Plus 演示 

下面是输出结果，这里％表示注释. 

> arch3.fit=garch(intc-l # -garch(3,0)) 

> summary(arch3.fit) 

Call i 

garch(formula.mean = intc - 1, formula.var = - garch(3 # 0)) 
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Value Std•Error t value Pr(>|t|) 

C 0.01741 0.006231 2.794 2.737e-03 

A 0.01258 0.001246 10.091 O.OOOe-fOO 

ARCH ⑴ 0.35258 0.088515 3.983 4.094e-05 


> stdre8i=archl$residuals/archl$sigxna.t % Standardized 

> autocorTest(stdresi,lag=10) % residuals 

Null Hypothesis ； no autocorrelation 

Test Statistics ： 

Test Stat 13.7820 p.value 0.1832 

Diet. under Null : chi-square with 10 degrees of freedom 

> archTest(stdresi,lag=10) % ARCH test for residuals 

Null Hypothesis : no arch effects 
Test Statistics: 

Test Stat 11.3793 p.value 0.3287 

Dist. under Null : chi-square with 10 degrees of freedom 

> archl$asymp-sd % Obtain unconditional variance 
[1] 0.1393796 

> plot(archl) % Obtain various plots # including the 

% fitted volatility series. 

去掉两个不显著的参数，我们得到的模型为 

r t = 0.017 4 + a t , a \ = 0.012 6 + 0.352 6 aj_ v (3.11) 

其中各参数估计的标准误差分别为 0.006 2, 0.001 2和 0.088 5,且所有估计都是高 
度显著的.图 3*4 显示的是标准化的残差{^}的时间图和标准化残差{兩}的某些 
函数的样本 ACF . 标准化残差{屯}的 Ljung-Box 统计量为 Q (10) = 13.78, p 值为 
0.18. {苟}的 Ljung-Box 统计量为 Q (10) = 11.38, p 值为 0.33, 参见输出结果.因 
此，在5%的显著性水平下， (3.11) 式的 ARCH ( l ) 模型能充分地描述给定数据的条 
件异方差性. 

(3.11) 式的 ARCH ⑴有一些有趣的 性质： 首先， Intel 公司股票的月对数收益 
率的期望值大约1.74%,这是值得注意的，特别是样本包含了 Intel 公司泡沫后的 
时期； 其次，努= 0.353 2 < 1/3,从而 Intel 公司股票月对数收益率的无条件四阶矩 
是有限的；再次， r , 的无条件标准差是 v /0.012 6/ (1 - 0.352) = 0.139 4;最后，该 
ARCH ( l ) 模型可以用来预测 Intel 股票收益率的月波动率. 

学生4分布的新息 

为了比较，在新息服从学生分布的假定下给该序列拟合个 ARCH ( l ) ^ 
型： 

r t = 0.022 1 十 of = 0.013 4 十 0.249 2a}_^ (3.12) 
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间隔 


间隔 


图3^4对 Intel 公司股票从1973年1月至2003年12月的月对数收益車建立高斯 ARCH ⑴ 
模型 (3.11) 式后，各种模型检验统计量的值 ： （ a )，（ b ), ( c ) 分别是标准化残差本身、它 
们的平方以及绝对值序列的样本 ACF , ( d ) 是标准化残差的时间图 


其中各参数估计的标准误差分别为 0.006 0, 0.002 0 和 0.115 6. 学生分布自由度 
的估计值是 6.16, 标准差是 1_6 5 . 所有估计值在 5% 的水平下是显著的,但 心 的/统 
计量仅为 2 . 16. 叫的无条件标准差是 v/0.013 4/ (1 - 0.249 2) = 0.133 6, 这与正态性 
假定下得到的 Z 统计量的值 相近. 标准化残差的 Ljung-Box 统计量为 Q(12) = 16.1, 
P 值为 0.19, 证实均值方程是充分的.但是，标准化残差平方的 Ljung - Box 统计量 
的值为 Q(12) = 29.91, v 值为 0.002 9. 波动率方程在 5% 的水平下是不充分的.进 
一步的分析表明，拉格朗日乘子检验统计暈的值为 g(10) = 13.07, p 值为 0.22 .波 
动率方程的不充分性是由于标准化平方残差中存在更高阶的相关性. 

比较模型 （ 3.11) 式和 （ 3.12) 式，我们可以看到以下几 点：⑷ 使用具有厚尾分 
布的 q 可以降低 ARCH 效应； （ b) 对这个特殊例子来说，这两个模型差别不大.最 
后，对这组数据更适合的模型是 GARCH (1，1) 模型，对此将在下一节给出讨论 .' 

S - Plus 演示 

带 < 分布的新息. 

> archXt^garch(-garch (1 # 0) , cond•dist= # t # ) 

> summary(archltl 
Call ： 

garch(formula.mean = intc - 1, formula.var * - garch(1 # 0) # 
cond.dist - n t w ) 
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Mean Equation ： intc - 1 

conditional Variance Equation ： - garchU, 0) 

Conditional Distribution : t 

with estimated parameter 6.159751 and standard error 1.6470*34 
Estimated Coefficients : 


Value Std•Error t value Pr(>|t|) 

C 0.02213 0.006010 3.681 1.333e-04 

A 0.01338 0.001965 6.809 2.001e-ll 

ARCH(l) 0.24916 0.115574 2.156 1.587e-02 


AIC(4) = -477.9073, BIC(4) = -462.2317 

Ljung-Box test for standardized residuals : 

Statistic P-value Chi A 2-d.f. 

16.1 0.1868 12 

Lj\ing-Box test for squared standardized residuals ： 

Statistic P-value Chi*2-d.f. 

29.91 0.002882 12 

注释在 S-Plus t . 命令 GARCH 允许几种条件分布具体来讲是， cond . dist ^ 
" t ’， 或 < f ged *», 缺省时为高斯分布. □ 

例 3 . 2 考虑马克对美元十分钟时间间隔汇率的百分比变化量.图 3-2 a 已经给山 
了该数据的时间图.如图 3 - 3 a 显示的，此序列没有序列相关性，但其平方序列的 
样本 PACF 有些大的值，特别是间隔为1和3时.在某些较大的间隔时， PACF 
有较大的值.但较小的间隔更重要一些.按照前一小节讨论的方法，我们将对该 
序列拟合一个 ARCH (3) 模型. 利用条件髙斯似然函数，我们得到拟合的模型是 
rt = o.ool 8 十 atEt fn 

^ 2 - 0-22 x HT 2 + 0.322 a ?_ 1 + 0.074 a ?_ 2 4- 0.093 a ?_ 3 , 

其中波动率方程中所有的估计在5%的水平下都是统计显著的，标 准误差 分别是 
0.47 x 10-8, 0.017, O.Oie 和 0.014, 用标准化的 残差心 进行的模型检验，表明了该 
模型是充分的. 


3.5 GARCH 模型 

虽然 ARCH 模型简单，但为 f 充分地描述资产收益率的波动率过程，往往需 
要很多 参数. 例如，考虑下面例 3.3 中的 S & P 500 指数的月超额收益率，其波动率 
过程需要 ARCH (9) 模型来刻画.这样就必须寻找其他模型. Bollerslev (1986) 提出 
了一个有用的推广形式.称为广义的 ARCH 横型 (GARCH). 对于对数收益率序 











100 第 3 章条件异方差樓型 


列 r t , 令叫= 7 •广糾 为 < 时刻的新息•称 a t 服从 GARCH(m,s) 模型，若 a t 满足 
下式： m , 

at = < r t e u (Tt = q 0 + ^ 4 - ^2 (3.13) 

*=1 j=l 

其中是均值为0、方差为 1 的独立同分布随机变量序列， a 0 >0, a^O^^O, 

max(m t .9) 

E ( a , 十 A ) < 1 (这里对 i > m ， 卬 = 0,对 _;• > a ，馬 一 0). 对叫十 A 的限 
制件保址的无条件方差是有限的，同时它的条件方差 of 是随时间变化的.如 
前曲一样.通常假定 e t 是标准正态的或标准化的学生-< 分布或广义误差分布.若 
s = 0, (3.13) 式就简化成一个 ARCH(m) 模型 . a : 和巧分别称为 ARCH 参数和 
GARCH 参数. 

为了弄清 GARCH 模型的性质，采用如下表示是有用的.令印= 4 - tr t 2 , 也 
即 of = a? - ?/t. 把 ofy = a?— - = 0, - •• ,s) 带入 （3.13) 式，我们就能把 

GARCH 模型改写成如下形式 

max(m ， A) 9 

a? = nt 0 4- ^2 (fUfli) a^_. + 氓 一 i- (314) 

«=1 j = l 

容易验证 {印} 是-个铁差序列（即 E7ft = 0且对 J •彡1有 COV(7/t,7^_j) = 0) .但{%} 
—般不是独立同分布序列. (3.14) 式对序列 < 来说是 ARMA 形式，囚此 GARCH 
模型可认为是 ARMA 的思想对平方 序列# 的应用.利用 ARMA 模型的无条件均 
值，我们有 

E (a^) =-- . 

只要上式的分母是正的. 

GAHCH 模型的优点和缺点，可以通过对最简单的 GARCH(1，1) 模型的分析看 
出. GARCH(1，1) 模型为 

a? = OI0 十 + P \ oi-u 0 ^ ai, /Si 彡 1， Q：1 十负 < 1. (3.15) 

第一，大的或引起大的 of, 这意味着大的会紧跟着另一个大的 
这样就会产生在金融时间序列中有名的“波动率聚集”现象.第二，可以证明：若 
1 —2a ?-( tti + 汍) 2 >0,则 

E(aj) 3[l-(a^^) 2 ] ^ 

[jB(a?)] 2 1 -( ⑴ +A) 2 — 2«? • 


从而，与 ARCH 模型类似， GARCH (1,1) 过程分布的尾部比正态分布尾部厚.第三， 
此模型给出了一个简单的参数函数来描述波动率的演变. 
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GARCH 模型的预测可用类似于 ARMA 模型的方法 得到. 考虑 （3.15) 式的 
GARCH (1,1) 模型,假定 h 为预测 原点. 对向前一步预测，我们有 

^-bi =«o + Pial ， 

其 中叫和 4在时间指标力 * 处是己知的.因此，向前一步预测为 
(1) = «o 4 - oia^ 4 - 

对向前多步预测，我们用= a ^ el 并把 (3.15) 式的波动率方程改写成 
=Q：o + («1 aiaf (e\ - 1). 

当*=/»+1时,此方程变为 

^+2 = a 0 -!-(«! QictJ + 1 (ej +1 - 1). 

因为 E 问 +1 — 1 |凡 ）= 0,故以/ ! 为预测原点的波动率的向前 2 步预测满足 

a h (2) = «0 + (ai (1). 


一般地，我们有 

al ( I ) = a 0 + ( a ! - I - (/ - 1), l > 1. (3.16) 

这个结果与自回归多项式为 l-( ai +负）忍的 ARMA ( U ) 模型是完全相同的.对 
(3.16) 式重复迭代，我们得到向前/步预测能写成 


4(/) = 


«o (^-(叫+仿/一 1 ’ 


+ (« 1 +/3 1 广 1 4(1). 


从而，只要 ai - f - A < l , 就有 


° i (0 一 : j ---当 Z -» OO 时. 

1 - - Pi 

因此， 只要山 的无条件方差 Vax ( a t ) 存在，当预测步长趋于无穷时， GARCH (1,1) 
模型的向前多步波动率顸测是收敛于 Vai ^ ot ) 的. 

关于 GARCH 模型的文献非常多，读者可参见 Bollerslev , Chou 和 Kroner (1992), 
BoUerslev , Engle 和 Nelson (1994), 以及这两篇文章的参考文献. GARCH 模型与 
ARCH 模型有相同的弱点，例如，它对正的和负的“扰动，’有相同的反应.另外，新 
近关于高频金融时间序列的实证研究表明 GARCH 模型的尾部太薄，即使新息是服 
从学生分布的 GARCH 模型， 也不足以描述实际高频数据的尾部.关于 GARCH 
模型峰度的研究,参见 3.16 节. 
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3.5.1 实例说明 

ARCH 模型的建模方法也可以用来建立一个 GARCH 模型.然而， GARCH 模 
型的阶不太容易确定.在实际应用中，只用到低阶的 GARCH 模型，如 GARCH (1,1) 
模型、 GARCH (2，1) 模型、 GARCH (1，2) 模型等.假定波动率 { af } 的初始值是已知 
的，条件最大似然法仍然可以用.例如，考虑 GARCH ( l . l ) 模型，若认为4是固定 
的，则 GARCH (1，1) 模型的疗可以递推得到.在一些应用中，叫的样本方差作为 
4的初始值较好.可以用标准化的残差 A = a t / a t 和它的平方序列来检验所拟合 
的模型的充分性. 

例 3.3 在这个例子中，我们考虑 S & P 500 指数的月超额收益率，从1926年开始， 
共792个观察值，如图3~5所示.记 n 为超额收益率.图 3-6 所示的是 n 的样本 
ACF 和 d 的样本 PACF . r t 序列在间隔为1和间隔为3时有少许序列相关性，但 
主要特征还是4的 PACF 显示强烈的 线件相 关件.若拟合 MA (3) 模型，则得到 

rt = 0.006 2 + o < 4- 0.094 4 at_i — 0.140 7 at _3, a a = 0.057 6, 

其中所有的系数在5%的水平下都是显著的.然而，为简单起见，我们使用 AR (3) 
模型： 

r t = + < h r t - 2 十 < hn -3 + + at . 

在正态性的假定下，所拟合的 AR (3) 模型为 

r t = 0.088 r t _i - 0.023 r t _ 2 - 0.123 r t _ 3 + 0.006 6 + a t , a \ = 0.003 33. (3.17) 

对 GARCH 效应，我们用 GARCH (1,1) 模型 

at = crt£u of = Oq + + ttlOt-l- 



时间指数 

图 3>5 S & P 500 指数月超额收益率的时间序列图 







0 5 10 15 20 25 30 

间隔 

图 3-6 ( a ) S & P 500 指数月超额收益率的样本 ACF ; ( b ) 月超额收益率平方的样本 PACF 
对该 AR (3)- GARCH (1,1) 模型进行联合估计得到 

n = 0.007 8 + 0.032 r t _i - 0.029 r 卜 2 - 0.008 r t _ 3 + 
cr'f = 0.000 084 + 0.121 + 0.852 3 af _ x . 

由波动率方程, A 的隐含的无条件方差为 

0.000 084 一… 

1 - 0.852 3 - 0.121 3 = 0 003 17 ’ 

这与 (3.17) 式中的的非常接近.然而，均值方程中的各参数的比表明三个自回 
归系数在5%的水平下都不显著.因此，我们去掉所有自回归系数來改进模型，改 
进后的模型为 


n = 0.007 6 + 01 ， CT t a = 0.000 086 + 0.121 6af_ x + 0.851 (3.18) 

均值方程中常数项的标准误差为 0.001 5, 而波动率方程中三个参数的标准误差分别 
为 0.000 024, 0.019 7 和 0.019 0. a t 的无条件方差为 0.000 086/ (1 - 0.851 1 - 0.121 6) 
= 0.003 14. 这是一个简单的平稳 GARCH(l.l) 模型.对于 (3.18) 式的 GARCH(1,1) 
模型.图 3*7 所示的是被估波动率过程 q 和标准化的“扰动”屯= a t / tx t 的时间图. 
at 序列看起来像白噪声过程，图 3-8 给出了标准化残差&和赶的样本 ACF, 这 
两个 ACF 不能表明在标准化残差过程中有显著的序列相关性或条件异方差杜.更 
具体地说，对我们有 Q(12) - 11."(0. 4 5) 和 Q(24) = 28.52(0.24), 对碎有 
Q(12) = 13.11(0.36), Q(24) = 26.45(0.33), 括号中的数为对应检验统计量的 p 值. 
因此，模型似乎能充分描述收益率序列和波动率序列的线性相依关系.注意到所拟 
合的模型表明 心十忒 = 0.977 2, 非常接近于 1. 这种现象在实际中是常见的，以 
至于经常在 GARCH(1 ， 1) 模型中加上限制 q 十仇 =1， 从而引出求和 GARCH (或 
IGARCH) 模型，见 3.6 节. 





104 第 3 章条件异方差樓型 


1940 I960 198" 

年 

m 3-7 (a) 对 S&P500 指数的月超额收益佔计出的波动率的时间序 列图; （ b) S&P500 指数的月 

超额收益率的标准化“扰动"的时间序 列图. 两个图都是基于 (3.18) 式的 GARCH(1,1) 
模型 


( a ) 



图3>8对 S & P 500 指数的月超额收益率所建的 GARCH (1,1) 模型 (3.18) 式的模型 检验： 
( a ) 标准化残差的样本 ACF ; ( b ) 标准化残差平方的样本 ACF 

最后，为了预测 S & P 5 UU 指数的月超额收益率的波动率，我们 nj 以用 (3.18) 式 
屮的波动率 力程. 例如，在預测原点/ I ,有 # +1 = 0.000 086 + 0.121 6 a ^ +0.851 \ a 2 h . 
向前1步预测是 

al (1) = 0.000 08G 十 0.121 Qa\ + 0.851 1^, 

其中办是 t 时刻均值方程的残差，4由波动率方程得到_初始值4可取0或 
的无条件方差.对多步向前预测.我们可以利用 (3.16) 式的递推公式.表 3-1 给出 
了基于 (3.18) 式的 GARCH (1,1) 模型、以 /i 为预测原点对 S & P 500 指数月超额收 
益宇的均值以及波动率预测的结果. 
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表 3-1 S & P 500 指数的月起额收益率的波动率预测.预测原点为/» = 792,对应的时间 
点为1991年12月.此处，波动率是条件标准差 


预测步长 _1_2_3_ 

收益率 ~ 0.007 6 0.007 6 0.007 

波动率 0.053 6 0.053 7 0.053 


0.007 6 0.007 6 0.007 

0.053 8 0.053 8 0.056 


例 3.3 中用到的一些 S - Plua 命令 

> fit=garch(sp - ar (3>, -garch(1 # 1)) 

> summary(fit) 

> fit=garch(sp-l # -garch(l # 1)) 

> summary(fit) 

> naniGfl (fit) 

[1 】 "residuals" H sigma.t n ” df.residual" "coef" "model" 

[6] "condLcJist" "likelihood” "opt.index" M cov" 

[10 】 "prediction” ” call" "asyinp.sd" "series" 

> % Next, compute the standardized residuals 

> stdresi=fit$residual8/fit$sigma.t 

> autocorTest(stdresi,lag«24) 

> autocorTest(stdresi A 2 # lag=24) 

> predict(fit,5) % Compute predictions 

注意到在上述命令中波动率序列存储在 fit $ sigma . t 中，收益率的残差序列 
存储在 fit$residuals 中. 

学生 - t 分布的新息 

假定~服从自由度为 5 的标准化学 S 4分布，我们重新估计 GARCH (1，1) 模 
型，得到 

r t = 0.008 5 + a t , of = 0.000 12 + 0.112 + 0.843 20^, (3.19) 

其中参数的标准差分别为 0.001 5, 0.51 x 10- 4 , 0.0 2 9 6和 0.037 1,这个模型本质 
上是-.个 IGARCH (1,1) 模型，因为 ai + A » 0.95, 非常靠近 1. 标准化残差的 
Ljung - Box 统计量为 Q (10) = 11.38, p 值为 0.33, 而苟的 Ljuug - Box 统计量为 
Q (10) = 10.48, p 值为 0.40. 这样所拟合的带学生 - t 分布新息的 GARCH ( U ) 模 
型是充分的. 

用到的 S - Pius 命令 

> fiti = garchtsp-l.-garchdl} ,cond.dist=,t, ,cond.par=5, 

♦ cond.est^F) 



> stresi*fitl$residuals/fitl$sigma.t 

> autocorTest(stresi r lag=10) 

> autocorTest(stresi A 2 # lag^io) 

自由度的估计 

如果我们更进一步地拓展上述 GARCH (1,1) 模型，其中学生分布的自由度 
不是给定的而是通过数据估计出的，得到的模型为 
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r t = 0.008 5 + a tl = 0.000 12 + 0.112 la ?_! + 0.843 2< r t 2 _ lt (3.20) 

其中所估计的自由度为 7.02. (3.20) 式中参数估计值的标准误差与 (3.19) 式的非常 
接近，自由度估计的标准误差为 1.78. 从而，在 5% 的显著性水平下我们不能拒绝 
使用自由度为 5 的学生 -t 分布. 

用到的 S - Plus 命令 

> fit2 = garch(sp-l,~garch(l,l) , cond . diBt = , t # ) 

> summary(fit2) 

3.5.2 预测的评估 

由于资产的波动率是不能直接观测的，所以比较不同波动率模型的预测表现对 
数据分析师来说是一个挑战.文献中，有的研究人员利用样本以外 ( out - of - sample ) 
的预测，比较波动率的预测值 4(/) 与预测样本中的“扰动”来评价波动模铟 
的预测表现 P 用这个方法常常会发现和 d ⑴有较低的相关系数.即低的尺 2 . 
这个发现并不奇怪，因为单独的本身不能充分度量/» + /时刻波动的率.例如， 
对向前一步预测.从统计观点讲 ， E (4 +1 |凡> = ^ +11 因此 a 〖 + i 是 4 +1 的相合 
估计. 但它不是 crl ^ 的精确估计，因为一个有已知均值的随机变量的单个观测值 
不可能提供该随机变量方差的精确估计.从而，严格地说.这种评价波动率模型预 
测表现的方法是不正 确的. 关于 GARCH 模型预测评价的更多信息，读者可参见 
Antierseu 和 Bollerslev ( 1 998). 

3.5.3 两步估计方法 

基于 （3.14) 式,可以用两步估计方法来估计 GARCH 模型.第一步，忽略 ARCH 
效应.用第2章讨论的方法（例如最大似然方法）为收益率序列估计一个均值方程. 
残差序列用 表示. 第二步，将 {4} 作为观测序列，可以用最大似然方法估计 
(3.14) 式中的参数.用 土和式 分别表示 AR 系数和 MA 系数，则 GARCH 模型的 
参数估计为戌=么，心=忒 L 显然，这样的估计只是真实参数的一种近似，它 
们的统计性质并没有得到严格的研究.然而，限定在定范围内的经验表明，这个 
简单的方法往往能够提供好的近似，尤其是当样本容量适中或较人时更是如此.例 
如，考虑例 3.3 中 S & P 50 Q 指数的月超额收益率.用 SCA 中的条件似然方法，我们 
可以得到下述 模型： 

r t = 0.006 l + a f , = 0.000 14 + 0.958 3 a?_i +Vt~ 0.845 6^_ i . 

其屮.所有的佔计在5%的显著性水平下都显著地不为 0. 从这些估计中看出 ，戾 = 
U .845 6, «i = 0.958 3 - 0.845 6 = 0.112 7. 这种近似估计与 (3.18) 式和 (3.20) 式中 
的估计非常靠近.进一步地,用两步估计方法拟合的波动率与图 3-7 a 也非常靠近. 

~ ①也就是把整个样本分成两个部分 . 用 - 部分（往往是大部分）来预测另一部分（称为预测样本)，可得 
和 ajj ⑴. - 潘者注 





3.6 求和 GARCH 模型 107 


3.6 求和 GARCH 模型 


若 (3.14) 式中的 GARCH 表示的 AR 多项式有一个单位根，则我们就得到了 
IGARCH 模型. 因此， IGARCH 模型就是单位根 GARCH 模型.类似于 ARIMA 模 
型, IGARCH 模型的主要特点是过去的平方扰动印_, = aL - i > () 对 g 的 
影响是持久的. 

一个 IGARCH (1,1) 模型能写成 

a t = a t £u = a 0 + 尽 十 （1 - 汍） a^x ， 

其中 { q } 与前面一样定义，1 >汍 > 0.对 S & P 500 指数的月超额收益率数据估计 
出的 TGARCH(l . l ) 模型为 

r t = 0.006 7-1- at , at = a t €t^ 

af = 0.000 119 + 0.805 9 of_ t +0.194 laf j , 

其中波动率方程中各估计的标准差依次是 0.001 7、 0.000 013、 0.014 4. 参数的 
估计值与前面的 GARCH ( l , l ) 模扭很 接近，但这两个模型间有一个大的差别.在 
IGARCH (1,1) 模型下，的无条件方差，也即^的无条件方差，是没有定义的.这 
一点对超额收益率序列是难以验证的.从理论观点看， IGARCH 现象可能会是波动 
率常有的水平移动所引起的.波动率持续性的真正原因值得仃细研究. 

当 ai + A = 1时，由 （3.1 G ) 式重复迭代得到 

cxl (0 = ^( l )- f (/- l ) a o , (3.21) 


其屮是预测原点.由此， 4(1) 对将来波动率的效应也是持续的，波动率预测形 
成了一个斜率为邱的 直线. Nelson (1990) 研究了在 IGARCH 模型卜波动率过程 
o } 的某些概率性质.过程疗是一个鞅，它在文献中有一些漂亮的结果可用.在一 
些条件下，波动率过程是严平稳的.但不是弱平稳的，这是因为它的前两阶矩不存 
在. 

在研究 IGARCH (1，1) 模型时， a o = 0 的情形是特别令人感兴趣的.这时，对所 
有预测步长，波动率的预测值都是4 (1), 参见 （3.21) 式.这个特殊的 IGARCH (1,1) 
模型正是风险度量系统 RiskMetrics 所用的波动率模型，这个系统是一种计算风险 
值 (Value at Risk ) 的方法（见第7 章). 该模型也是序列 { a ?} 的指数平滑模型，为 
说明这点，将模型改写为 

trf = (1 - -h (3iaf_ x 

= (1 - + 汍 [(1 - / 3 ) o ?_ 2 -h 0 i <^_ 2 ] 

=(1 _ )o-t -1 + (1 - + Pl°t-2 
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重复迭代得到 

a ? = (1 - + A <* e — 2 4-+ …)， 

这就是著名的贴现因于为仇的指数平滑 公式. 因此，指数平滑方法可以用来估计 
这样一个 IGAHCH(1, 1) 模型 • 


3.7 GARCH-M 模型 

在金融中，证券的收益率会依赖于它的波动率.为了给这种现象建模，人们会 
考虑 GARCH - M 模型，其中 “ M 1 , 表示收益率的条件均值为 GARCH(GAECH in 
the mean ). 简单的 GARCH (1,1)- M 模型能写成 

rt = /x + cof + at ， at = attt 1 

of = o-o + a , (3.22) 

其中 / i 和〃是常数.参数 c 叫做风险溢价参数_ c 为正值意味着收益率与它的波动 
率成正 相关. 文献中还出现过其他一些具体的风险溢价的形式，如 r t = // + ca t 十叫 

和 r t = // 丨 cln <7 f + a t . 

(3-22) 式的 GARCH - M 模型蕴涵着收益率序列 n 存在序列相关性.这种序列 
相关性是由波动率过程 {^} 的序列相关性导 致的. 风险溢价的存在是历史股票收 
益率具有序列相关性的另一种原因. 

为了说明 GARCH - M 模型的应用，我们考虑给 S & P 500 指数从1926年1月 
至 1"1 年12月的月超额收益率拟合一个 GARCH (1,1)- M 模型，并假定该模型的 
新息服从高斯分布.所拟合的模型为 

rt = 0.005 5 + 1 09 af + at , 

= 8.76 x 10— 5 + 0.123 af_j + 0.849 er t 2 _ 1 , 

其中均值方程中两个参数的标准误差分别为0.00 2 3和 0.818, 波动率方程中三个 
参数的标准误差分别是 2.51 x 10- 5 , 0.020 5和 0.019 6. 该指数收益率的风险溢价 
的估计值是正的，但在5%的水平下不是统计显著的.这里的结果由 S - Plus 得出. 
表3~ 2 给出了 S - Plus 中 GARCH - M 模型的一些其他具体形式.风险溢价的思想也 
可应用于其他 GARCH 模型. 

_ 表3~ 2 S - Plus 中所允许的 GARCH-M 的具体形式》 

_ g ( gt ) _命 令 

(Tt 

_ ln ( of ) 



logvar. in. mean 


均值方程是 rt =/i + c<7(<Tt) + ttt. 




3.8 指数 GARCH 模型 109 


S-Plus 演示 

> sp.fit = garch(sp-l+var.in.mean,-garch(l # 1)) 

> summary(sp.fit) 


3.8 指数 GARCH 模型 

为了克服 GARCH 模型在处理金融时间序列时的一些弱点， Nelson (1991) 提出 
了指数 GARCH ( EGARCH ) 模型.具体地，为了允许在模型中体现正的和负的资产 
收益率的非对称效应，他考虑加权的 新息： 


5⑹=私 + 7 [ kt | - E (| e t |)], (3.23) 


艽中0和7是实常数 . Q 和 | e t |- E (| e t |) 都是零均值的独立同分布序列，且有连续 
的分布.因此， E[g(e t )]=0. g(e t ) 的非对称性容易从下式 看出： 

_ f (^ + 7)^-7 E (| t t |), 若 0彡0， 

° €t \ (^-7) et -7^(1^!), 若 e t <0. 


注释对标准高斯随机变量 e ,， E (| e <|)= 对 （3.7) 式中的标准化学生 


分布，我们有 


E ( N ) 


2y/^2r((v+l)/2) 
(u - 1)T (u/2) y/ii 


EGARCH ( m , s ) 模型能写成 


= a t e t , In ( of ) = ai 0 十 卜一 _ 如丑 m 9 { e t - i ) , (3.24) 

其中 ao 是常数，/?是向后推移算子使得 Bg ( e t ) = l +/3 ifl + … + U S-1 

和 i- aiB - a m B m 是多项式,它们的根都在单位圆外且没有公因子.根在单 

位圆外，意味着根的模大于 1. (3.24) 式又一次用通常的 ARMA 参数化形式来描述 
a t 的条件方差随时间的演变.基于这个表示， EGARCH 模型的一些性质可以用与 
对 GARCH 模型所用的类似方法得到，例如 In (^)的无条件均值为勿.然而，这 
个模型在如下几点上与 GARCH 模型 不同： 第一，它使用条件方差的对数，放松了 
对模型系数非负性的 限制； 第二， g ( e t ) 的使用，使得对叫的正的和负的延迟值，模 
型的反应不对称. EGARCH 模型的其他性质可在 Nelson (1991) 中找到. 

为了更好地理解 EGARCH 模型，我们考虑阶为 （1,1) 时的简单 情形： 


at = ( r t £u (1 - aB ) In { a }) = (1 - a ) a 0 + (^- i ), (3.25) 


其中 { e t } 是独立同分布标准正态序列，〜的下标被省略了.在这种情 形下， - 
x /2^, In {^)的模型变成 


(1 - aB ) In ( of ) = 


a. -H (7 + 0) £t-u 
a . + (7 - 0 ) (- e t - i ) 


当彡 0 时， 
当 e t -i < 0 时, 


(3.26) 
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其中 or » = (1 — a)«o - 这是一个非线性函数，类似于 Tong (1978, 1990) 中 

的门限自回归 （ TAR , threshold autoregressive ) 模型.这里我们只要知道：对这个简 
单的 EGARCH 模型来说，条件方差以非线性方式依赖于的符号.具体地说， 
我们有 


of = <T^fj exp (a.) 


exp 

卜)沄 j 

exp 



当 Of_i > 0 时， 
当 a t _i < 0时， 


系数 （7 + 的 和 （7 - W 表 明模型对正的和负的 ay 的非对称响应.因此， 当 0 # 0 
时模型是非线性的.由于负的扰动往往带来更大的影响，我们假定0是负的.对高 
阶 EGARCH 模型来讲,非线性性变得复杂得多 . Cao 和 Tsay (1992) 利用非线性模 
型，包括 EGARCH 模型，得到向前多步波动率的预报.第4章将讨论金融时间序 
列的非线性性. 


3.8.1 模型的另一种形式 


EGARCH ( m , s ) 模型的另一种形式为 


ln ( o ?) = + + E 外 (3.27) 

i=i 内 - * j=i 

这里，正的对对数波动率的贡献为 ai ( i +7 i ) kt -< l , 而负的对对数波动率 
的贡献为 Q ： t(l — 7 i ) k <- *1 >其中— at-i/at-i- 参数 7* 表示 〜_,• 的杠杆效应.在 
实际应用中，我们仍然假定 7< 为负的.这是& • Plus 中所用的模型形式. 

3.8.2 实例说明 

Nelscm (1991) 把 EGARCH 模型应用到价值加权市场指数的月超额收益率上, 
数据是从证券价格研究中心得到的，时间区间是从1962年7月至1987年12月. 
超额收益率是用价值加权指数的收益率减去国库券的月收益率，假定一个月中每一 
天的国库券收益卒是常数.共有6 408个观察值.用 r , 表示超额收益率，所用模型 
为 

Tt=<b \ ca \ + a tl (3.28) 

In ( cr ?) = o： 0 + In (1 +. wJV t ) + - ~J ( Q - i ) ， 

其中 4 是给定下的条件方差， M 是第 < -1 个交易日和第 f 个交易日之 
间的不交易的灭数， a 0 和是实参数，由 （3.23) 式定义 . 服从 (3.9) 式的 
广义误差分布.与 GAB . CH - M 模型相似， (3.28) 式中的参数 c 是风险溢价参数.表 
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3-3 给出了模型的参数估计值和它们的标准误差. (3.28) 式的均值方程有两条性质 
值得 注意： 第一，它用 AR (1) 模型来刻画超额收益率中的序列相 关性； 第二，它用 
波动率 d 作为回归变量来解释风险溢价.所估计出的风险溢价是负的，但是统计 
不显著的. 


表 3-3 对价值加权 CRSF 市场指数的日超额收益率估计出的 AR (1)- EGARCH (2, 2) 


模型，数据是从1962年7月全1987年12月 


参数 



M 

TO 


"Mg' 








标准误差 






参数 






Siw 

估计值 

一 0.118 

3.5 x 10~ 4 

0.205 

-3.361 

1.576 


标准误差 

0.009 

9.9 x 10 -5 

0.012 

2.026 

0.032 



3.8.3 另一个例子 

作为另一个说明，我们来考虑 IBM 股票从1962年1月至1997年12月的月 
对数收益率，共864个观察值.拟合一个 AR (1)- EGARCH (1,1) 模型： 


r | — 0.010 5 十 0.092 r ^ 一 1 十 at , at ate “ (3.29) 

In (of) = -5.496 4 -工 一 ^ 獅 咖 - i ) ， 
g ( e t _ i ) = -0.079 5 e t _i 4 - 0.264 7 [\£ t - i \ - \/ Vn ] , (3.30) 

其中 { ft } 是一列独立的标准高斯随机变置所有参数估计值在5%水平下都是统 
计显著的.至于模型的检验.标准化的残差过程= q / q 的 Ljung - Box 统计量为 
Q (10) = 6.31(0.71) 和 Q (20) = 21.4(0.32), 而对平方过程 Q (10) = 4.13(0.90) 
和 Q (20) = 15.93(0.66)，括号中的数是 p 值.因此，在所拟合模型的残差序列中没 
有序列相关性或条件异方差性，这说明所拟合的模型是充分的. 

由估计出的波动率方程 （3.30) 式，并利用\/27^« 0.797 9,我们得到波动率方 

程力 


In (of) = -1.001 + 0.85Gln 十 


0.185 2 e t -u 
-0.344 2 e t -u 


当 > 0 时， 
当 fit -1 < o 时. 


作一个反对数变换，我们有 


( e 0 l86 2e *-S 当 e t _i 彡0时， 
\ e~ a344 把- 1 ，当 < 0 时 • 


此方程说明了在 EGAR . CH 模型下波动率对过去正的和负的“扰动”的反应不对称. 
例如，当标准化的“扰动”扰动两个单位（即两个标准差）时， 
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g ? (^ e-i = ~2) = exp [-0.344 2 x (-2)] _ n.318 _ ! 
of ( c t -i -2) exp (0.185 2 x 2) ~ ~ 

因此，变动两个标准差的负“扰动”对波动率的影响要比相同强度的正“扰动，，的 
影响高37.4%.这个例子清楚的显示出 EGARCH 模型的非对称 特征. 一般来说, 
“扰动”越大，正负“扰动”对波动率的影响的差别就越大. 

最后，我们将样本区间进行扩展，使其包含1998年到2003年的对数收益宇， 
共有93 6 个观测.我们用 S-Plus 拟合一个 EGARCH (1, 1) 模型，结果如下. 

S-Plus 演示 


输出结果. 

> ibm.egarch=garch(ibmln-1 , -egarch(1,1),leverage=T, 

+ coad.diut= , ged^) 

> summary(ibm.egarch) 

Call ： 

gareh(formula.mean = ibmln - 1, formula.var - egarch(1,1), 
leverage = T,cond.dist = "ged") 

Mean Equation ： ibmln - 1 

Conditional Variance Equation ： - egarch(1, 1 ) 

Conditional Distribution ； ged 

with estimated parameter 1.5003 and standard error 0.09912 


Estimated Coefficients : 

Value Std.Error t 

value 

Pr(>|t|) 

C 0.01181 

0.002012 

5.870 

3,033e-09 

A -0.55680 

D.171602 

3.245 

6.080e-04 

ARCH(l) 0.22025 

0.052824 

4.169 

1.669e-05 

GARCH(l) 0.92910 

D.026743 

34.742 

0-000e+00 

LEV(l) -0.26400 

0,126096 

-2.094 

1.828e-02 

Ljung-Box test for 

standardized residuals ： 

Statistic P-value 

Chi A 2-d.f. 



17.87 0.1195 

12 



Ljung-Box test for 

squared standardized residuals: 

Statistic P-value 

Chi*2-d.f. 



6,723 0.8754 

12 




拟合的 GARCH (1, 1) 模型为 

r t = 0.011 8 + a t , at =( Tt £ t , 

) = -0.557 + 0.220 4a “ + 0 .929 (3.31) 
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其中 e t 服从参数为 1.5 的 GED 分布.基于模型残差及其平方的 Ljimg-Box 统计量 
表明模型是充分的.正如所预料的那样，输出结果 表明： 估计出的杠杆效应是负的, 
并且在5%的显著性水平下是统计显著的，比是 -2.094. 

3.8.4 用 EGARCH 模型进行预测 

我们用 EGARCH(1,1) 模型来说明 EGARCH 模型的向前多步预测.假定模型 
的参数已知，新息服从标准高斯分布，我们有 

In (<r t 2 ) = (1 - Q!i) Of 0 + oti In -b g , 

9 = Oe t -i -h 7 - y/2/nj . 

两边取指数，模型变成 

= tr^} exp [(1 - ai) oro] exp [g (e t _i)], 

9 { et - i ) = ^t-i+7 (kt-x|- V^)- (3-32) 

设是蚀测原点，对向前 1 步蚀测，我们有 

4+1 = 十哪 [U - ai)au]exp[g (e h )] , 

其中右边的所有量都是已知的.因此以/I为预测原点的向前1步的波动率预测是 
的⑴= ai +x , a 2 h + l 由上式给出.对向前2步预测， (3.32) 式给出 

0^+2 = ex P [U - ai)oo]exp[^ (e h+ i)]. 

在 /i 时刻取条件期望，我们有 

( 2 ) ^ ^h 01 ( 2 ) ex P [( x - a i) a o] E, t {exp [g (e " 十 i)】} ， 

其中 E/« 表示在时间原点 h 所取的条件期望.上述期望可以由下式 得到： 

E{exp[5(e)]} =J exp 卜 + 7 ㈤ - 

=exp (-7 兩） [r e ( fl+ ") e ；^ e_ea/：id£+ L e ( ㈠ ) e S e_ea/2 H 

= «xp (-7V^A) [e (fl+ ^ )3/2 ^ (沒十 7) 十 (7 — 6>)] ， 

其中和 $( x) 分别表示标准 m 态分布的概率密度函数和累积分布函数.因此， 
向前2步波动率预测值为 

(2) = cr 2 h X ( X ) ex P [C 1 - a i) a ° - 
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x {exp [(<9 + 7) 2 /2]办(沒 + 7) + [⑺一 7) 2 /2] (7 — 沒)} . 

重复前面的步骤，我们得到向前 j _ 步预测的递推 公式： 

U)=^l a ' (j-l)exp(u;)x |oxp |^(6> I 7)2/2] 中 (6>+7)+exp [(6>~7) 2 /s] ^(7-^)} - 

其中 u ; = (1 - ai ) a 0 - ly /2 f ^. $ (0 + 7 ) 和 $ (7 — 0) 的值可以从统计软件包中得 
到.另外,可用第6章附录 B 中的方法得到这些值较精确的近似. 

作为例子，考虑 3.8.3 节为 IBM 股票月对数收益率（时间终点是1997年12 
月）建立的 AR (1)- EGARCH (1,1) 模型.利用所建立的 EGARCH (1，1) 模型，可以 
计算该序列的波动率预测. 在预 测原点 f = 864,预测 值是心 64 (1) = 6.05 x 10_ 3 , 
的 64 ⑵= S .82 x in ~ 3 , ai G4 (3) = 5.63 x 10_ 3 , ^ (10) = 4.94 x 10一 3 .这些预测值 
逐步收敛到 (3.29) 式中的“扰动”过程的样木方差 4.37 x 10-3. 

3.9 门限 GARCH 模型 


另外一个经常用来处理杠杆效应的波动率模型是门限 GARCH 模型（或 
TGARCH 模型)，可参见 Glosteu, Jagannathon 和 Runklc(1993) 以及 Zakoiau(1994). 
一个 TGARCH(m,. 9 ) 模型假定： 

Jt m 

erf =a 0 -\- + -h Pj<r}_ v (3.33) 

i=l i=X 

其中 N t - t 是关于负 a t _, 的指示变董，即 


Nt-i = 



若 a t -i < 0, 
若 > 0, 


和内 为非负参数.满足类似 T GARCH 模型的条件.从模型中可以看出正的 
a * 一，对疗的贡献为而负的••对 疗 有更人的贞献（％+%)<_<,其中 
7* >0. 该模型用0作为门限来分隔过去扰动的 影响. 也可以用其他的一些门限值, 
参见第4章门限模型的一般概念.模型 (3.33) 也称为 GJR 模型，因为 Glosten 等 
人（1即3)实质上给出了同样的模型. 

作为例子，考虑 IBM 股票从1926年到2003年的月对数收益率.拟合的 
TGARCH (1, 1) 模型 如下： 


r t = 0.012 1 + a<, a t =a t e t , 

<r t 2 = 3.45 x IO - 4 4 - (0.065 8 + 0.084 +0.818 2of_j, 

其中新息服从 GED 分布，所估计的 GED 分布的参数为1.51，标准误差为 0.099. 
均值方程参数估计的标准误差是 0.002, 波动率方程参数估计的标准误差分别是 
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1.26 x l ( r 4 , 0.031 4, 0.039 5 和 0.049. 为检验所拟合的模型，对标准化的残差心有 
Q (12) = 18.34(0.106), 对好有 Q (12) = 5.36(0.95). 从而模型对对数收益率的前两 
阶条件矩的建模是充分的.基子所拟合的模型.打杆效应在5%的显著性水平下是 
显著的. 

所用到的 S-Plus 命令 


> ibm.tgarch - garch(itomln-1 # -tgarch(1,1) , leverage=T t 
+ cond.dist= # aed # ) 

> summary(ibm.tgarch) 

> plot(ibm.tgarch) 

比较为 IBM 股票的对数收益率所建立的 (3.31) 式和 （ 3.34) 式会发现这两个 
模型是很有意 思的. 假定 a t -i = ±2<r t _i, 于是= 士 2 .由 EGARCH(1, 1) 模型 
可得 

^l=e°- 22x2x0 - 632 « 1.264. 




另方面，忽略掉常数项 0.000 345,由 TGARCH (1. 1) 模型得 

< r 2 t { e t -i = -2) ^ [(0.065 8 + 0.084 3)4 + 0.818 2 } af_ t 
= 2) 免 (0 065 8 x 4 + 0.818 2 ) a^_ x 


这两个模型给出了相似的杠杆效应. 


3.10 CHARMA 模型 

人们在文献中已经提出很多其他的经济模型来描述 (3.2) 式中条件方差4的 
演变.我们介绍一下条件异方差 ARMA ( CI - IARMA ) 模型，此模型是用随机系数来 
产生条件异方差性（见 Tsay (1987)). CHARMA 模型与 ARCH 模型不同，但这两个 
模型有相似的二阶条件性质. CHARMA 模型定义为 

r* = //t -f a*, ai = 占 uat_i + S2tCh.-2 4 -- h S m tOi-m (3.35) 

其中 {%} 是均值为零、方差为吋的高斯白噪声序列.{屯} = 是 

一列独立间分布的随机向量序列，其均值为（)、协方差阵为非负定阵《，并且 {&} 
与{取}独立.本节将用向量与矩阵运算的一些基本性质来简化叙述.读者可以参 
考第 8 章的附录 A . 在此对这些性质作一些简短的回顾.对 m > 0,模型可写成 

at = a[-iStT/t, 

其中 a t _i = - Ji a t 的延迟值构成的向量，在 i 1时刻是已知的. 

从而， (3.35) 式的 CHARMA 模型中 a , 的条件方差为 

a t = + a^^ov ( S t ) a t -i = a * + ( at - i , • • • , o ， t - m ) ^ ( at - i * • - • , o t _ m / , (3.36) 
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记 n 的第 { i , j ) 个元素为叫.因为矩阵是对称的，故= u ; 7 i . 若 m = 1，则 (3.36) 
式简化为 ( r \ = a % 4- o ； iia ?_ 1 , 这是一个 ARCH ⑴模型，若 m = 2, (3.36) 式变为 

of = + WnO?_l +2a>i20t-l0t-2 + ^22»t-2i 

这不同于 ARCH ⑵模型.因为有交叉乘积项 a,_,a t _ 2 . -般地，若 O 为对角阵，则 
CHARMA(m) 模型的条件方差等于一个 ARCH(m) 模型的条件方差.因为 n 是协 
方差阵，它是非负定的，而#是方差、是正的，故我们有对仟何〖成 
立.换句话说，在 CHARMA 模型下 a t 2 自动地是正数. 

ARCH 和 CHARMA 模型的明显区别是后者在波动率方程中有的延迟值的 
交叉乘积项.这些交叉乘积项在一些应用中会有用.例如，在资产收益率建模中，交 
叉乘积项表示前面的收益率的相互作用.可以想象，股票波动率依赖于这些相互作 
用.然而，交叉乘积项的个数随着阶 m 迅速增加，因此需要某些限制以使模型简单. 

些可 能的限制是在 CHARMA 模型中只用少数交叉乘积项. ARCH 和 CHARMA 
模型的另一个区 别是： 髙阶 CHARMA 模型的性质比 ARCH 模型的性质更难得到， 
这是因为处理多元随机变量比较困难. 

作为例子，我们对前面 GARCH 建模已用的 S&P500 指数的月超额收益举建 
立一个 CHARMA 模型： 


所拟合的模型为 


ri = a t , at = Si t a t i + & 2t^t 2+ Vt- 


rt — 0.006 35 4- ot ； Ot — 0.001 79 +.( at — i ， at — 2 ) 合 （ a t _ j ， at - 2 )' ， 


其中 

^ _ 0.141 7(0.033 3) -0.059 4(0.036 5) 

-0.059 4 (0.036 5) 0.308 1 (0.034 0) 

括号中的数是标准误差.穴的交叉乘积项的 i - 比为-1.63,它是在10%的水平下 
边际显著的.如果我们把模型改进为 


rt = 00 + at, at = Sitdt-i 4 - S2ta t ~2 4 - + Vt^ 

但假 定心与 ( S u , S 2 t ) 是不相关的，则我们得到的拟合模型为 

rt = 0.006 8 + < h ， of = 0.001 36+ a t _2, at - 3 ) n ( at _ i , Ot _2, atsY , 


其中 h 的元素及其标准误差（在括号中给出）为 


S7 = 


0.121 2 (0.035 5) -0.062 2 (0.028 3) 0 

-0.062 2 (0.028 3) 0.191 3 (0.025 4) 0 

0 0 0.298 8 (0.042 0) 




所有的估计值在5%的水平下是显著的.对该模型，山 = r ,- 0.006 8是月轺额收益 
率与它的平均值的 偏离. 所拟合的 CHARMA 模型说明前两个延迟值之间存在某 
种相互作用.实际上，波动率方稈可近似地写成 

4 = 0.001 36 + 0.12 a 2_! - 0.12 a t _ iat _ 2 + 0.19 g _ 2 + 0‘30#_ 3 . 

当 o ,_, o ,_ 2 为负时，条件方差要稍大一些. 

解释变量的效应 

我们很容易把 CHARMA 模型推广，使得模型中的波动率依赖于某些解释 
变量.设是 f 时刻叫观测的 m 个解释变量.考虑模型 

m 

n = 糾十叫， a t = ^2 -b vt, (3.37) 

•=1 

其中心 =( tf u ， … ，< y mt )' 和 r /, 是 (3.35) 式中定义的随机向量和随机变量.那么， 
的条件方差为 

= 戊 ? + (*1.4-1 ， … * Xm,t-\ ) - • - ， : r m ,*—i)'- 

在实际应用中，解释变量可能会包含 a t 的某些延迟值 • 

3.11 随机系数的自回归模型 

文献中，随机系数自回归 (random coefficient autoregressive , RCA ) 模型是为了 
考虑不冋体制间的变化而提出的，类似于计量经济学中的面板数据分析 (panel data 
analysis ) 和统计学中的分等级模型 （hierarchical model ). 我们把 RCA 模型当作条 
件异方差模型来阐述，但历史上，它是通过允许参数随时间演变来得到过程的条件 
均值方程的更好 描述. 称时间序列 { r t } 服从 RCA ( p ) 模型，如果 { r t } 满足 

P 

n =如 + E (成 + 心） r t _i+ai, (3.38) 

1=1 

其屮/，是正整数， {&} = ,6 pt y ] 是一列独立的均值为0、协方差阵为 as 

的随机向量.且{屯}与 {〜} 是独立的.关于该模型的更详细的讨论，参见 Nicholls 
和 Quinn (1982). (3.38) 式中的 RCA 模型的条件均值和条件方差为 

P 

叫 = E ㈣ 朽 _ ： l) = 0O+X1 如卜 “ af = ^ + ,r t _ p )n 5 (r t -i, •• - , r t - p )\ 

i -1 

与 CHARMA 模型形式上相同.但 RCA 和 CHAHMA 模型阆存在微妙的差 别：对 
RCA 模型，波动率是观察到的延迟值 rv — 的二次函数，而在 CHARMA 模型中，波 
动率是延迟的新息的二次函数. 
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3.12 随机波动率模型 

另一种描述金融时间序列波动率演变的方法是：对 a t 的条件方差方程引进一 
个新息.具体讨论可参见 Melino 和 Turnbull (1990), Taylor (1994), Harvey , Ruk 和 
Shephard (1994), . Tacquier , Poison 和 Rossi (1994). 结果得到的是随机波动率模型. 
与 EG ARCH 模型相似，为了保证条件方差为正的， SV 模型用 In ( of ) 而不是 
SV 模型定义为 

at — (1 — — ^ In ( trf ) = + Vt ， (3.39) 

其中 q 独立同分布且服从汉 (0, i ), 独立同分布且服从 TV (0, d ), 且 { e t } 和{%} 
是相互独立的， a 0 是常数，多项式1 - 史叫皮的所有根的模大于 1. 引进新息 W 

很大程度地增加了模型的灵活性，但也清‘了参数估计的困难.为了估计 SV 模型、 
我们需要通过 Kalman 滤波或者 Monte Carlo 方法来应用伪似然 （ quasi - likelilioocl ) 
方法. Jacquier , Poison 和 Rossi (1994) 给出了伪似然和 Monte Carlo 马尔可夫链 
( MCMC ) 方法的估计结果之间的比较.估计 SV 模型比较困难是可以想象的，因为 
此模型中用了两个新息 c t 和.第12章将讨论一个 MCMC 方法去估计 SV 模 
型.关于随机波动率模型的讨论，请参考 Taylor (1994). 

Jacquier , Pulstm 和 Russi (1994) 的附录中给出了一些 SV 模型当 m = 1时的 
性质.例如，当 m = 1时， 

In (a t 2 ) - N G , j-^) = N ( 外， 4) ， 

且 E ( a ?) - exp + afJ 2 ] , E ( af ) = 3 exp [2 /iJ ，和 corr ^. a^J = 

[ expKal ) 1]/ [3 cxp (^)- l ]. 限定在一定范围内的经验告诉我们， SV 模型 
常常在模型的拟合上有改进.但在样本以外的波动率预测上与其他模型相比却时好 
时坏. 

3.13 长记忆随机波动率模型 

最近，有人利用分数差分方法，进一步推广了 sv 模型，允许波动率有长记忆 
性.正如第2章所讨论的，一个时间序列是一个长记忆过程，如果当间隔增加时自 
相关函数以幂函数（而不是以指数速度）衰减.在波动率的研究中引进长记忆模型 
的动机是这样一个 事实： 虽然资产收益率序列本身没有序列相关性，但收益率的绝 
对值或平方序列的自相关函数常常衰减很慢.参见 Ding . Granger 和 Engle (1993). 
图:所示的是 IBM 股票和 S & P 500 指数从1962年7月3日至2003年12月31 
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日的日收益率绝对值序列的样本自相关函数.这两个样本 ACF 都是正的取值大 
小中等,但衰减很慢. 


0.4 

3 0.2 
^ 0.1 

- 0.1 


0.4 
r 0.3 

fe 0.2 
< n.i 


_tu 


(ii) S&P 500 指数 



(, 50 100 150 200 

间 m 

( b ) IBM 股栗收益率 



S3 3-9 S&P500 指数和 IBM 股票 H 对数收益率绝对值序列的样本 ACF, 时间区间是 1962 年 

7 月 3 日至 2003 年〗 2 月 31 日 . 两个水平虚线表示渐近的 5% 水平的上.下限 

简单的 K 记忆随机波动率 (LMSV) 模型可写成 


a t = (Tt = (Texp ( u t /2) ， (1- B ) d u t = Th ， (3.40) 

其中 a > 0, c , 独立同分布服从 N (0, l )， Vt 独立同分布服从 AT (0,4)且和 q 相互 
独立， 0< d < 0.5. 长记忆的特征源 P 分数差分 （1 - 它可推出叫的 ACF 以 
幂函数（而不是以指数函数）衰减.对模型（3.40)，我们有 

In (of) = In (a 2 ) + + In (ej) 

=[in (<r 2 ) + E (In4)] + 叫 + [In (sf) - E (lnsf)] = + /z t | e t . 

这样 ， In ( a ?) 序列是一个高斯长记忆过程加上一个非高斯白噪声，见 Breidt , Crato 
和 de Lima (1998). 长记忆随机波动率模型的估计很复杂，但分数差分参数 rf 是可以 
用伪最大似然法或回归方法来估计的.对 S & P 500 指数中运用的公司股票的曰收 
益率.取平方后再取 对数. 利用这样的一些序列， Bollerslev 和 . h , binski (1999), Ray 
和 Tsay ( 2 000) 发现(/的中位数估计约为 0.38. Ray 和 Tsay (2000) 以各种不同特征 
对公^进行分类，研究了各类公司股票的日波动率的共同的长记忆成分.他们发现 
同一行业公司会有更趋相同的长记忆成分 （例 如，美国大的国有银行和金融机构). 
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本节中，我们运用本章讨论过的波动率模型来研究有实际重要性的一些问题. 
所用数据是从1926年1月至 199 9 年12月的 IBM 股票和 S & P 500 指数的月对数 
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收益率.共有888个观察值,收益率以百分比形式给出并包括了分红.图 3-10 所示 
的是这两个收益率序列的时间阁.汴意到该节的结果都是用 RATS 程序得到的. 


1040 10GU 1080 ‘200U 

m .VI n IBM 股票和 SfcP500 指数月对数收益率的时间图.样本时间段是从 1926 年 i 月至 
1999 年 12 月.收益率以百分比给出并包括了分红 

例 3.4 我们关心这样的 问题： 是否一支股票的日波动举在夏季比较低？如果是， 
低多少？对这两个问题肯定的回答在股票期权定价中有实际意义.我们用图 3-10 a 
所示的 IBM 股票的月对数收益率作为例子来说明怎样回答这两个问题. 

记月对数收益率为〜给数据拟合一个高斯 GARCH (1,1) 模型： 

rt = 1.23 + + 叫， a t = tr t et, (3 41) 

erf = 3.206 + 0.103a?_i + 0.8250^!. 

均值方程中的两个参数估计值的标准误差分别为 0.222 和 0.037, 波动率方程中三 
个参数估计值的标准误差分别为 0.947, 0.021， 0.037. 对标准化的残差心= a t / a t , 
Ljung-Box 统 计量力 Q (10) = 7.82 (0.553) 和 Q (20) = 21.22 (0.325), 括号中为 p 值. 
这样，均值力程的残差没有序列相关性.而刘 a ?， Q (10) = 2.89(0.98) 和 Q (20) = 
7.26(0.99). 表明标 准化残差中无条件异力差性.所拟合的模型似乎是充分的，这个 
模型是进一步研究的出发点. 

为了研究资产波动率的夏季效益，先定义一个示性 变量： 

= r 1,若< 表示的是六月、七月、八月， 2 , 

Ut = \ 0 ，其他， 

并把波动率方程修改为 



—-lu-30 「 - 2 U 


of = a。 + + + ut (aoo + 炫 1 。 4— i + 1) • 
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这个方程用两个 GARCH (1,1) 模型来描述一个股栗收益率的波 动率： 个模型针 
对夏季的月份，另一个计对剩下的月份.对 IBM 股票的月对数收益率 ; ai 0 和汍 0 
的估计值在10%的水平下是不显著的，因此我们对方程进行改进，得到 
Tt = 1.21 + 0.099r ( _i -f at, at = a t eu 

(rf = 4.539 + O.llSa^! -f O.SIGofq - 5.154u t . (3 . 43 ) 


均值方程中参数估计倌的标准差分别是 0.218 和 0.037, 波动率方程中参数估计的 
标准差分别是 1.071, 0.022, 0.037 和 1.900. 标准化残差的 Ljung-Box 
统计量的值为 Q (10) = 7.66(0.569) 和 Q (20) = 21.64(0.302), 因此，在标准化残 
差序列中没有序列相关性.而对句，其 Ljung - Box 统计量为 Q (10) = 3.38(0.97)， 
Q (20) = 6.82(0.99), 这表明在标准化残差中也没有条件异方差性.改进后的模型看 
起来是充分的. 


比较（ 3 .<41)和 (3.43) 式中的波动率方程，我们会得出如下结论.第一，因为系 
数 - S .1 54 与零显著的不同, p 值为 0.006 7,从而股票波动率的夏季效应在1%的 
水平下是统计显著的.另外，估计值的负号证实了 IBM 股票月对数收益率的波动 
率在夏季确实较低.第二，把 (3.43) 式中波动率模型改写成 


{ -0.615 -f O . llSa ?.! + 0.816 a t 2 _ 1} 若《 是六月、七月、八月份， 
1 4.539 + 0.113^_! + 0.816 of _ t , 其他， 


负常数项 - 0.615 = 4.539 - 5.154 与直观不 一致. 然而，因为 4.539 和 5.154 的标准 
误差相对较大，估计值之差 - 0.615 可能不会显著地不同于 0. 为了证实这点，我 
们限制波动率方程中的常数项对夏季月份是0,然后重新拟合模型.利用如下方程 


of = atiaf^ H-+7(1 -u t ). 

所拟合模型为 


r t — 1*21 + 0.099 rt _ i 十 ch ， at = ( Tt£tj 

a 卜 0.114a?，! + O.Blla?—! + 4.552 (l-u t ). (3 44) 

均值方程中参数估计的标准误差分别为 0.1219 和0.038,波动率方程中参数估计 
的标准误差分别为 0.022, 0.034 和 1.094. 标准化残 差屯的 Ljung - Box 统计量 
为 Q (10) = 7.6 S 和 Q (20) = 21. 6 7,好的 Ljung-Box 统计量为 Q (10) = 3.17 和 
Q (20) = 6.85. 检验统计量的这些值与前面得到的值很靠近，在 5 %水平下都是不 
显著的. 

(3-44) 式的波动率可用来评价夏季效应在 IBM 股票波动率卜的体现作为说 
明，基于 （3.44) 式，对1999年的 IBM 月对数收益率来说和 g 的中位数分别是 
29.4 和 75.1. 利用这些值，我 们有： 对夏季月份 4 = 0.114 x 29.4+0.811 x 75.1-64.3, 
对其他月份 of = 68.8. 这两个波动率之比为 64.3/68.8 « 93%.也就是说，在夏季 
月份 IBM 股票的月对数收益率的波动率减小7%. 
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例 3.5 S & P 500 指数在衍生产品市场上被广泛应用，因此对它的波动率建模是一 

个研究热点.此例中，我们所问的问 题是： 组成 S & P 5( )« 指数的单个股票过去的收 
益率对该指数现在的波动率建模是否有影响？这个问题的详细研究超出了本章的 
范围，这里我们仅用 IBM 股票过去的收益率作为解释变量来说明下这个问题 • 
数据如图：所示， S & P 500 指数的月收益率序列记力利用 n 和高斯 
GARCH 模型，我们得到如下特殊的 GARCH (2, i ) 模型 

r t = 0.609 + at , at = < rt £ t , trf = 0.717 + 0.147 a ?_ 2 + ( J .839 of _ i . (3.45) 

均值方程中常数项的标准误差为 0.138, 波动率方程中参数的标准误差分别为 0.214, 
0.021 和 0.017. 基于标准化残差屯= ot / at , 我们有 Q (10) = 11.51 (0.32), Q (20) = 
23.71 (0.26), 括号内为 p 值.对句， Q (10) = 9.42(0.49), Q (20) = 13.01 (0.88). 从而， 
在5%的水平下.模型是充分的. 

使用 IBM 股票作为 S & P 500 指数的成分，下面我们评价其过去的收益率对 
S & P 500 指数波动率建模的影响.作为一个简单的说明.我们把波动率方程修改为 

of = a 0 + a 2 a^_ 2 + t3\a\_ x +7 (^t-l - 1-24 ) 2 ， 

其中： r t 是 IBM 股票的月对数收益率 .1.24 是 x , 的样本均值.对 r t 拟合的模型 
变为 


n = 0.616 + o t , at = a t e t , (3 46) 

a { = 1. U 69 + 0.148 af _ 2 + 0.834 of _! - 0.007 ( x f _i - 1.24) 2 • 

均值方程中参数估计的标准误差为 0.139. 波动率方稈中各参数估计的标准误差分 
别为 0.271, 0.020, 0.018 和 0.002. 关于模型的检验，对标准化残差屯= nt / tT t , 
Q (10) = 11.39 (0.33). Q (20) = 23.63 (0.26), 而对 a ?，Q (10) = 9.35(0.50), Q (20) = 
13.51(0.85). 因此，此模型是充分的. 

因为检验7 = 0的7,值为 0.003 9,所以延迟间隔为1的 IBM 股票收益率对 
S & P 500 指数波动率的影响在1%的水平下是显 著的. 系数的符号是负的，这一点 
是可以理解的.这意味着延迟间隔为1的 IBM 股票的收益率能减小 S & P 500 指数 
波动率.表3>4给出了利用 （3.45) 和 (3.46) 式的模型给从1999年7月至 I 2 月的 
S & P 500 指数拟合的波动率模型.从表中可看出， IBM 股票对数收益率的过去值对 
S & P 500 指数波动率确实有影响. 

表 3~4 用带和不带 IBM 过去对数收益竿的横型拟合的 SfcPROn 指数从 1999 年 7 月至 


12月的月对数收益率的波动率 


n 

7/99 

8/09 

9/99 

10/99 

11/93 

12/99 

模壻 (3.45) 

模型 (3.46) 

26.30 

23.32 

26.01 

23.13 

24.73 

22.46 

21 (>9 

20.00 

20.71 

19.45 

22.46 

18.27 
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3.15 其他方法 

本节考虑两种其他的波动率建模方法. 

3.15.1 高频数据的应用 

French , Schwert 和 Stambaugh (1987) 考虑了 M —种估计波动率的方法.他们用 
髙频数据太计算低频收益率的波动率.近年来，这种方法已经有了一些吸引力，因为 
高频金融数据越来越容易获得（参见 Andersen , Bollerslev , Diebold 和 Labys (2001 a , 
b )). 

假设我们对某资产的月波动率感兴趣，并且我们可以获得该资产的日收益率. 
令 rT 是该资产 的第* 个月的月对数收益率.同时假设第 < 个月有 n 个交易日，这 
个月中的 U 对数收益率为 { r M }； L r 利用对数收益率的性质.我们有 

n 

r\ n = E r ". 

<=1 

假设条件方差和协方差#在，则 

n 

Var(rr \F t -i ) = ^； Var (r M ) + 2^Cov [( 〜，〜 • ） (3.47) 

i<j 

其中是第 t -1 个月已知的信息.如果添加另外的假定，上式可以简化.例如， 
若假定 {r ui } 是白噪声序列，则 

Var(r[" ) = nVar (r u ) , 

其中 Vai ( r M ) 可以用口收益率 { r M }? =1 估汁 出来： 

d 2 = E ?-1 (rt，‘ - ft) 2 , 
n - 1 

其中 f t 是第*个月中的日对数收益率的样本均值即从而，月 
波动率的估计为 

91 

^m = rtf . (3.48) 

若 { r M } 服从一个 MA ⑴模型，则 

Var (ry 1 |F t _i) = nVar (r u ) + 2 (n - 1) Cov (r ttl ,r tt2 ). 


它的估计可由下式 给出: 
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= zrzi 5 Z ( r M _ n ) 1 ( r M - f *) (^,<+i - n ). (3.49) 

t=l t=l 

上述波动率估计的方法很简单，但在实际应用中会遇到一些困难.笫一，对口 
收益率 { r t , t } 的模型是未知的，这就使 （ 3.47) 式中协方差的估计复杂 化了. 第二， 
每个月大约 21 个交易口，是个小样本，这就使 (3.47) 式中方差和协方差的估计的 
精确性值得 怀疑. 估 II 的精确性取决于 { r tii } 的动态结构和它的分布.若曰对数收 
益率有较高的超额峰度和较强的序列相关性，则 （ 3.48) 和 （ 3.49) 式中的样本估计 
ol x 甚至是不相合的（参见 Bai, Russell 和 Tiao(2U04)). 为了使这种方法更有实用 
价值，还需要更进一步的研宄. 

例 3.6 考虑 S & P 500 指数的对数收益率的月波动率，时间是从1980年1月至 
1999年12月.我们用三种方法来计算波 动率. 第一种方法，用日对数收益率和 
(3.48) 式（即假定日对数收益率是白噪声序列).第二种方法，用日对数收益率但假 
定一个 MA ⑴模型（即用 （3.49) 式). 第三种方法是对1962年1月至1999年12 
月的月收益率拟合一个 GARCH (1, 1) 模型.我们使用更长的时间段是为了得到更 
精确的月波动率估计.所用的 GARCH (1, 1) 模型为 

r^ 1 = 0.G58 十 u t ， at = <^t = 3.349 十 0,08601^^ 十 0.7350^_ 1; 

其中是标准高斯白噪声序列.图: Ml 所示的是估计出的月波动率，我们清楚地 



图 3-11 S & P 500 指数对数收益率的月波动率估计值的时间图，时间范围是1980年1月至 

1999年12月： （ a ) 假定日对数收益率是白噪声 序列； （ b ) 假设日对数收益率服从 
MA (1) 模型； （ c ) 利用从1962年1月至1999年12月的月收益率和 GARCH (1,1) 
模型 










看到基于日收益率的波动率估计值要比基于月收益率和 GARCH (1，1) 模型的波动 
率估计值大许多.特别地，当使用日收益率时，1987年10月的波动率估计值大约 
为 680. 而为了三个图有相同的尺度范围，我们对它们进行了截断. 

在 (3.48) 式中，如果我们进一步假定 f , 的样本均值是0,则我们有^ 

1=1 

这时，一个月中日对数收益率的累积平方和就可以作为月波动率的估计.这个概念 
已经推 r 到用某项资产的夂易日内的对数收益率米估计日波动举.设 rv 表示某项 
资产的对数收益率.假定可以得到等间隔的交易日的对数收益率满足 r t = t r u . 

i=l 

称暈 

*=1 

为 r t 的已实现波动率，参见 Amlerseu 等 （200 ia ， b ). 从数学上来讲，已实现波动率 
是 r , 的-次变差，并且假定 { r ^ VU 是均值为 U ， 力差为有限的独立同分而随机变 
量序列.限定在一定范围内的经验表明， ln ( W c ) 通常近似地服从高斯 ARIMA (0, 1, 
q) 模型，该模型可以用来进行预测.更多的信息参见 11.1 节. 

已实现波动率的优点包括其简单性以及用到了交易日内的收益率.直观上讲， 
人们喜欢尽可能地选择大的 n 以便用到更多的信息.然而，当之间的时间间隔 
很小时，收益率将受到市场微观结构的约束（例如买卖价格弹性)，这经常会导致波 
动率的有偏估计.在构建已实现波动率时如何选择最优的时间间隔近来已经吸引了 
很多人去研究.美国交易比较频繁的资产通常用3〜15分钟的时间间隔.对股票收 
益率应用己实现波动率的另外一个重要问题是如何处理隔夜的收益率.即从第 f -1 
天的收盘价到第 （ 天的开盘价之间的收益.忽略隔夜收益率会严重低估波动率.另 
一方面，一定范围内的经验告诉我们，对于指数收益率和外汇收益率而言.隔夜收 
益率很小. 

在一系列最近的文章中 ， Barndorff Nielsen 和 Shcphard (2004) 已经用资产的高 
频收益率来研究资产收益率的双幂变化，并提出了一些方法來检测波动率中的跳 
跃. 

3.15.2 日开盘价.最高价、最低价和收盘价的应用 

对于许多资产，日幵盘价、最高价、最低价和收盘价都可以得到. Parkiu- 
aon(1980), Carman 和 Klata(1980), Rogers 和 Satchell(1991) 以及 Yang 和 Zhaug(2000) 
的研究表明可以用这些信息来改进对波动率的估计.图 3-12 给出了第 t 个交易日 
价格对时间的时间图，这里假定时间是连续的.对丁一项资产，定义如下 变量： 

• (^=笫《个交易日的收 盘价； 

• (^=第*个交易日的幵 盘价； 

• / = 一天内结束交易的分数； 
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•执=第< 个交易日的最 高价； 
•心二第*个交易日的最 低价； 

•巧=第 t - 1时刻所有的已知信息. 


交易收盘 交易幵盘 



常规的方差（或波动率）是 = E [( Ct - C t - i ) 2 \ F t . 1 ]. Garrnan 和 Klass (1980) 
考虑了 W 的几种估计，他们假定价格服从一个不带漂移的扩散过程（关于随机扩 
散过程的更多信息参见第 G 章).他们考虑的估计 包括： 


(Qt- Ct-i ) 2 

~V 

(m 


的 , t 


41 n (2) 


, ( Ct - Ot ) 2 
2 ( 1 -/) ' 
0.360 7 { H t - L t ) 2 . 


0</< l ； 


: 

a h 


+0 .83-r^- L ：\ 


( l -/)41 n (2)， 


0</< l ; 


0.5( 历- L t ) 2 - [2 ln (2) - l ]( C t 
- 0.386( C e - 0 ( ) 2 ; 


O t ) 2 , which is w 0.5( F t - L t ) 2 


• ai tt - 0.12-^ + 0.88^y, 0</< 1. 


他们还考虑 / 吏精确但吏为复杂的估计 & l t , 然而该估计与很靠近.定义波动 
率估计的效率因子为 

Var(dg， t ) 

Var ㈣ t) • 

Garraan 和 Klass (1980) 发现.对于所考虑的简单扩散模型，当 i = 1, 2, 3, 5, 6时, 
Eff ( o ? t ) 分别近似为2, 5.2, 6.2, 7.4 和 8.4. 注意 Parkinson (1980) 推导出了 / = 0 


Eff 的） 
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时的的, t - 

定义如下 变量： 

• Ot = ln (0<) - ln ( C <_ i ), 标准化开盘价： 

• tit = ln ( Ht ) — ln ( Ot ) ‘ 标准化最高价； 

• d t = ] n ( Lt ) - In ( O t ), 标准化最低价： 

• c t = ln ( C t ) - ln ( Ot ), 标准化收盘价. 

假定可以得到 n 天的数据，并目.波动率在一段时期内为常数. Yang 和 Zhang (2000) 
建议用下面的估计作为波动率的稳健 估计： 

= € + 喊 + (1 - 


1 

^rs — ~ — Ct) + dt(d. t — c t )], 

t=l 

_034_ 

= 1.34+(n + l)/(n —1). 

估计吃由 Rogers 和 SatcheU (1991) 提出，选择 fc 使得佔计的方差最小，其屮 
a 2 yz 是三种估计的线性组合. 

称童 H t — L t 为第《大价格变化的范围.该估计导致/基十价格变化范围的波 
动率估计，可参见，例如 Alizadeh , Brandt 和 Diebold (2002). 在实际中，股票价格只 
在离散时间点上可观测到.同样地.观测到的最高价格可能比 拓低， 而观测到的 
最低价格可能比 L , 高.因此，观测到的日价格范围可能会导致低估真实的价格范 
围，从而可能导致对波动率的低估.波动率估计中的偏差依赖于交易频率和股票的 
微小记录间隔.对于交易很密集的股票，可以忽略偏差.对于其他股票,则需要进一 
步的研究来更好地理解基于价格范围的波动率估计的表现好坏. 

3.16 GARCH 模型的峰度 

波动率估计中的不确定性是一个重要的问题.但它经常被忽视.为了评估被估 
波动率的易变性，人们必须考虑波动率模型的峰度.本节导出了 GARCH ( U ) 模型 
的超额峰度，同样的思想可应用到其他 GARCH 模型中.所考虑的模型为 


o*ct, 
1 - n 1 - n 


o) 2 ,e) 2 , 

I - 

(oe (ct 

ns-EH 

II II 


- 2 bo^ 


5 


at = orf=a 0 + 十 Pier'll 
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= K e (1- 3q ；) -f + 5^0 ； = K e + K ( a 9) + ^K £ Kj 9) 

l-3a?-K £ af - 1 - \K e K^ • 

上述结果表 明：对 GARCH ( U ) 模型来说，系数 m 在决定 fl t 的尾部行为时 
起关键作用. 若叫 = 0,则 Ki 9) = 0且匕= ftV 这时叫的尾部行为与标准化噪 
声 q 的尾部行为相似.若^ > 0,则 Ki 9) > 0, a t 过程有厚尾性. 

对一个（标准化的）自由度为 v 的学生4分布，若 V > 4 ,我们有 E (4) = 
W(v - 4) + 3. 因此，对 v > 4, q 的超额峰度为 AT e = 6/( V -4). 这就是本章 中当学 
生分布的自由度事先给定时我们使用4的部分原因.只要 l -2 a ? (v-l)/(v-A)~ 
(ai + 历 ) 2 > 0, 则 a t 的超额峰度变为 — [6 十 （v + 1) K l a a) ^ / [t; - 4 - K ( a 9) ^. 

附录波动率模型估计中的一些 RATS 程序 

在实例说明过程中所用的数据文件是 “sp500.t3tt ”， 该文件中包含的是 S&P500 
指数的超额收益率，共792个观察值. RATS 程序中的注释前面带 * 号. 

A 带常数均值方程的高斯 GARCH (1,1) 模型 

all 0 792:1 

open data sp500.txt 
data(org=obs) / rt 

*** initialize the conditional variance function 
set h = 0.0 

•** specify the parameters of the model 

nonlin mu aO al bl 

*** specify the mean equation 

frml at = rt(t)-mu 

*** specify the volatility equation 

frml gvar - a0+al*at(t-1)**2+bl*h(t-1) 

*** specify the log likelihood function 

frml garchln = -0.5*log(h(t)=gvar(t))-0.5*at(t)**2/h(t) 

“* sample period used in estimation 
smpl 2 792 

*** initial estimates 

compute aO = 0.01, al = 0.1, bl = 0 . 5 , mu = 0.1 

maximize(method=bhhh,recursive,iterations=150) garchln 

set fv = gvar(t) 

set resid = at(t)/sqrt(fv(t)) 

set residsq = resid(t)*resid(t) 

*** Checking standardized residuals 
cor(qstats,number=20,span^lO) resid 
*** Checking squared standardized residuals 
cor(qstats,number=20,span=10) residsq 

B 带学生 - t 分布新息的 GARCH (1,1) 模型 

all 0 792:1 

open data sp500.txt 
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l=obs> / rt 
0.0 

iu aO al bl v 
* rt(t)-mu 

ir « aO-t-al*at(L-l) **2+bl*h(t-1) 

« at(t)**2/(h(t)=gvar(t)) 

l = %LNGAMMA( (v-*-l) /2.) -%LNGAMMA (v/2 .) -0.5*log (v-2 .) 

i * tin- ( (v-fl) /2 .) *log (1.0-ftt (t) / (v-2.0))-0.5*log(h(t)) 

792 



all 0 864:1 

open data m-ibm.txt 
data (org=»obs) / rt 
set h - 0-0 

nonlin cO pi th ga aO al 

frml at - rt(t> cO pl^rt(t-1) 

frml epsi « at(t) / (sgrt(exp(h(t)))) 

frml g = th^epsi(t)+ga*(abs(epsi(t))-sqrt(2./%PI)) 

frml gvar « al 畲 h(t-l)+(l-al)*ao+g(t-l) 

frml garchln = -0.5*(h(t)-gvar(t))-0.5*epsi(t) 

smpl 3 864 

compute cO ® 0.01, pi » 0.01, th = 0.1 # ga » 0.1 
compute aO « 0.01, al = 0.5 

maximize(method=bhhh,recursive,iterations=150) garchln 

set fv » gvar(t) 

set resid * epsi(t) 

set residsq = reaid(t)♦resid(t) 

cor(qstats,number=20,span=10) resid 

cor(qstata # number«20 # span=10) residsq 


练习题 


3.1 对 GARCH(1,2) 模型，导出以 /j. 为预测原点的向前多步预测公式 . 

3.2 对 GARCH(2 ， 1) 模型，导出以 /i 为预测原点的向前多步预测公式 . 

3.3 假定 r ,， • • • ， n , 是来自于服从如下 AR(1)-GARCH(1,1) 模型的收益率序列的观 察值 : n = 
H -f 0ir { _j + o t , a t = «7 t et, of = mo + oiOt_i + 达 of-i, 其中 e t 是标准的高斯白 噪声 . 
导出这组数据的条件对数似然函数 . 

3.4 在上题中，假定心服从自由度为 u 的标准化的学生 -< 分布.导出数据的条件对数似然函 
数 . 

3.5 考虑 Intel 股票从 1973 年至 2003 年的月简单收益率，数据包含在文件 **m-intc7303.txf' 
中 . 将收益串转换为对数收益率.对转换后的序列建立个 GARCH 模型并计算以 2003 
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年12月为预测原点的向前1步至5步的波动率预测值. 

3.6 文件 ^- mrk . daf 包含了 Merck 股票从1946年6月到2003年12月的月简单收益率， 

有 两列： 日期和月简单收益率.把简单收益率变换成对数收益率. 

( a ) 对数收益率中有没有明显的序列相关性？用自相关系数和5%的显著性水平来回答该 
问题.如果有，则移除序列相关性. 

( b ) 此对数收益率存在 ARCH 效应吗？如果 （ a ) 部分屮有序列相关性，则该部分用其残 
差序列.用 Ljung - Box 统计量，对收益率平方（或残差的平方）的6个间隔和12个 
间隔的自相关系数，在5%的显著水平下回答该问题. 

( c ) 对数据识别一个 ARCH 模軋 然后给数据拟合被识别的模型，写出所拟合的棋型. 

3.7 文件 * in -3 m 4603. txt n 包括两列，分别是公司股票的 H 期和月简单收益率把收益率 

变换成对数收益率. 

( a ) 对数收益率存在 ARCH 效应吗？用6个间隔和12个间隔的自相关系数所构成的 
Ljung - Box 统计量，在5%的显著水平下回答该问题. 

( b ) 用收益率平方的 PACF 识别一个 ARCH 模型.所拟合的模型是什么？ 

( c ) 共有695个数 据点. 利用前690个观测重新拟合模型，并利用所拟合的模型来预测 
« = 691到 t = 695时的波动率（预测原点为 /I = 690). 

( d ) 对 3 M 股票的对数收益率建立一个 ARCH - M 模型.在5%的显著水平下检验风险 
溢价为（】的假设，得出你的结论. 

( e ) 利用前 tiyu 个观测对 3 M 股票的对数收益率建立一个 EGARCH 模型.利用所建模 
型计算以 A = 690为预测原点的向舫1步到向肋5步的波动举预测. 

3.8 文件 ** m - gmsp 5003. txt " 包含日期以及 General Motors 股票和 S & P 500 指数从1950年 

至1999年的月对数收益率. 

( a ) 给 GM 股票对数收益举建立一个带高斯新息的 CARCH 祺型. 检验模型并写出最后 
所拟合的模型. 

( b ) 给 GM 股票的对数收益率建立一个带高斯新息的 GARCH - M 模型.所拟合的模® 
是什么？ 

( c ) 给 GM 股票的对数收益率建立--个带学生4分布新息的 GARCH 模型，估计出自 
由度并写出最后拟合的模型.设 W 是学生分布的自由度，在5%的显著水平下检 
验假设 //o : w = 6对 // a : V / 6. 

( d ) 给 GM 股票的对数收益率建立一个 EG ARCH 模型.所拟合的模型是什么？ 

( e ) 利用对 GM 股票的对数收益率所拟合的所有波动率模型进行向前1步到向前6步预 
测，并进行比较. 

3.9 冉考虑文件 • m - gmsp 5003. txt ” 中的 GM 股票. 为序列建立一个充分的 TGARCH 模型. 

写出所拟合的模型并进行杠杆效应的显著性检验.给出向前 I 步到向前 G 步预测. 

3.10 再次考虑文件 in - gmsp 5003. txt 中的收 益率. 

( a ) 对 S & P 500 指数的月对数收益串建立一个高斯 GARCH 模型.仔细检验模型. 

( b ) 在该指数收益率的波动率中存在夏季效应吗？利用上小题中所建立的 GARCII 模型 
来回答. 

( c ) GM 股票的延迟收益率在该指数波动率建模中有用吗？利用本题中 （ a ) 所建的 GARCH 
模型作为基础模型来比较. 
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3.11 文件 “ d - gmsp 9303. txt ” 包含了 GM 股票和 S & P 500 复合指数从1993到2003的日简 
争收益率,有三列，分别是日期、 GM 股票收益率和 SP 收益率. 

( a ) 计算 GM 股票的日对数收益率.对数收益率中存在 ARCH 效应吗？你可以用平方收 
益率的10个延迟值和5%的显著性水平进行检验. 

( b ) 计算平方收益率序列的 PACF (10 个 M 隔以内的) • 

( c ) 给 UM 对数收益率拟合一个髙斯 GARCH 模型.进行检验，并写出所拟合的模型. 

( d ) 给序列建立一个带广义误差分布新息的 GAHCH 模型，写出所拟合的模型 • 

3.12 考虑文件 “ d - gm 8 p 9303. txt ” 中的 S & P 500 复合指数的日简单收益率 • 

( a ) 该简单收益率中存在 ARCH 效应吗？你可以用平方收益率的10个延迟值和5%的 
显著性水平进行检验. 

( b ) 为简单收益率序列建女一个充分的 r . ARHH 模型. 

( c ) 根据所拟合的模型计算简单收益率序列及其波动率的向前1步到向前4步预测. 

3.13 再次考虑文件 “ d - Rmsp 9303. txt ” 中 GM 股票的日简单收益率. 

( a ) 为序列拟合一个充分的 GARCH - M 模型，并写出该模型 - 

( b ) 为序列拟合一个充分的 EGARCH 模型.杠杆效应在5%的显著性水平下显著吗？ 
3.14 再次访问文件 “ d - gmsp 9303. txt ”. 然而，我们将研究市场波动率在单个股票波动率建模 

中的意义.将这两个收益率转换为对数收益率，并以百分比形式给出. 

( a ) 为对数 S & P 500 收益率建立一 ^带广 义误差分布的 AR (5)- GARCH (1，1) 模型. AR (5) 
模型中只包含延迟为3和5的值.用 “ spvol ” 表示所拟合的波动率序列. 

( b ) 把 “ spvol ” 作为外生变童为对数 GM 收益率序列建立一个 GARCH (1, 1) 模型.检 
验模型的充分性，并写出所拟合的模型.在 S-Plus 命令为 

fit « garch ( gm 〜1,〜 garcli ( l , l )+ spvol ， cond . dlst = c ged 1 ) 

( c ) 讨论所拟合棋型的意义. 

3.15 仍像以前那样考虑 GM 股票和 S & P 500 指数从1993年到2003年的日对数收益率的百 
分比.但我们研究 GM 股票的波动举对 S & P 500 指数波动率的建模有没有贡献.采取以 
下歩骤进行 分析： 

(«> 给 GM 股票对数收益率的百分比拟合一个带广义误差分布的 GARCH (1, 1) 模型. 
拟合的波动率用 “ gmvol ” 表示.将 “ gmvol ” 作为外生变量为 S & P 500 指数的对数收 
益率拟合一个充分的 GARCH 模型.将所拟合的模型写出来. 

( b ) 在为 S & P 500 指数收益率波动率的建模中， GM 股票收益率的波动率有用吗？为什 
么？ 
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第 4 章非线性模型及其应用 

木章主要讨论金融数据中的非线性问题和金融时间序列分析中有用的非线性 
经济计量模型.考虑一元时间序列为简争起见.假定观察的时间间隔是等距的. 
记 { x t \t = 1， ，: T } 为观察值， r 是样本容量.如第2章中所述，一个纯随机的时间 
序列称为线性的，如果它能表示成 

oo 

叫 = 綷十 XI (4.1) 

其中 P 是常数，内=1, A 是实数，{叫}是独立同分布的随机变量序列，它们共同 
的分布函数是合理定 义的. 假定 a t 的分布是连续的且 E ( ot ) = 0. 在许多场合下， 
我们进一步假定 Var ( a t ) = c 2 a , 更进一步地， a t 是高斯的.若4 g # < 00 ,则心 
是弱平稳的（也即心的前两阶矩不随时间变化).第2章中 ARMA 过程是线性的， 
因为它有形如 （4.1) 式的 MA 表示.任何不能表示成 (4.1) 式的随机过程称为是非 
线性的.这个非线性的定义是针对纯随机的时间序列.人们可以拓展这个定义，允 
许: c , 的均值是一些外生变量的线性函数，这些外生交量包括时间指标和某些周期 
函数.但这样的均值函数很容易用第2章中介绍的方法來处理，我们在此不作讨论. 
从数学上讲， A 的个纯随机时间序列模型是由现在和过去的“扰动”所构成的独 
立同分布序列的一个函数： 

xt = (4.2) 

当 /(•) 是其自变量的线性函数时，则而就是 （ 4.1) 式中的线性模型. /(.) 中的任何 
非线性性都会导致一个非线性 模型. 不能直接应用一般的非线性模型 （ 4.2 )， 因为它 
包含了太多的参数. 

为了把文献中可见到的非线性模型放在个合适的框架中，我们把^的模 g 
写成它的条件矩的形式.设巧是由 i -1 时刻已有信息产生的域.典型的 
是由 {而 - t ，: r t _ 2 ，...} 和中的元素线性组合而成的.给定 Ft _!, ® t 
的 条件均 值和条件方差分别是 

/ i t = E (: e g ( Ft - i ), rr \ = VorCxtlFe - j ) = *(巧- 1 )， (4.3) 

其中 ff (.) 和 Zi (.) 是有意义的函数， Zi (.) > 0. 这样，我们把模型限制为 


= g ( Ft - x ) + yyh { F t - x )£ t , 
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其中 q = a t / a t 是标准化的“扰动”(或新息).对 （4.1) 式中的线性序列 ar t , W .) 是 
F ,_, 中元素的线性函数. 

非线性模型的发展就在于 （4.3) 式中的两个方程的扩展.若 //(.) 是非线性的， 
则 A 称为是均值非线 性的; 若/ 1(.) 是时变的，则 A 是方差非线性的.第3章的条 
件异方差模型都是方差非线性的.因为它们的条件方差随时间变化.事实上，除了 
GARCH - M 模沏中&依赖于从而随时间变化外，第3章中所有其他的波动率 
模型都着眼于 (4.3) 式中条件方差方程的扩展或修改.基干熟知的 W «> ld 分解,一个 
弱平稳的、纯随机的时间序列能表示成不相关的“扰动”的一个线性函数_对于平 
稳波动率序列，“扰动”互不相关,但不独立.木章讨论的模型是另一种向非线性的 
扩展，这种非线性性由对 (4.3) 式中的条件均值方程的改动或扩展引起. 

统计学文献中已提出了许多非线性时间序列模型，如 Granger 和 Andersen 
(1978) 的双线性模型 (bilLucai model ). Toug (1978) 的门限自回 ！ d (tiuesliold autore ¬ 
gressive , TAR ) 模型 ， Priestley (1980) 的状态相依 ( state - dependant ) 模型和 Hamil ¬ 
ton (1989) 的马尔可夫转移 （Markov switching ) 模型.这些非线性模型的基本思想 
都是让条件均值函数^按简单的参数非线性函数随时间演变.近米,利用计算设备 
和计算方法上的进展,人们提出些新的非线性模型.这些扩展模型包括 Carlin , 
Poison 和 Stoffcr (1992) 的非线性状态空间建模, Chen 和 Tsay (1993 a ) 的泛函系数 
自回归模型， Chen 和 Tsay (1993 b ) 的非线性可加自回归模型以及 Lewis 和 Stevens 
(1991) 的多元适应回归样条.这些扩展的基本思想或者用模拟方法来描述^条件 
分布的演变或者用数据驱动 ( data - driven ) 方法来探索一个序列的非线性特征.最 
后，非参数和半参数方法，如核回归和人工神经网络，已经被用来探索时间序列中 
的非线性性 . 4.1 节将讨论一些可应用到金融时间序列分析上的非线性模型.包括 
一些非参数和半参数方法. 

除了各种非线性模型的发展，人们还对能区分线性序列和非线性序列的检验统 
计量的研究感兴趣现在可用的检验方法中既有参数检验又有非参数检验.大多数 
参数检验是利用拉格朗日乘子法或似然比统计量.非参数检验依赖于: r t 的高阶谱 
或依赖于针对混沌时间序列发展起来的维数相关系数 . 4.2 节将介绍一些非线性检 
验 方法； 4.3 节和 4.4 节讨论非线性模型的建模与 预测； 最后， 4.5 节给出了非线性 
模型的应用. 

4.1 非线性模型 

统计文献中发展起来的大多数非线性模型都是针对 (4.3) 式中的均值方程的. 
具体可参见 Priestley (1988) 和 Toug (1990) 中关于非线性模型的 综述. 这里，我们 
的 B 的是介绍一些能用到金融时间序列上的非线性模型. 
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4.1.1 双线性模型 

(4.1) 式的线杜模型只是 (4.2) 式的函数 /(.) 的一阶 Taylor 展开.这样，向非 
线性扩展的一个自然的推广就是使用这个展开的二阶项宋改进逼近.这就是双线性 
模型的基本想法.双线性模型可以定义为 

P 9 m 9 

Xt=C-\- ^2 + + (4.4) 

i=l j=l i=l )=1 

其中 p ， g , m 和 s 是非负整数.这个模型由 Granger 和 Andersen (1978) 提出，并得 
到广泛 研究 . Subba Rao 和 Gabr (1984) 讨论了这个模型的一些性质和 应用 ， Liu 
和 Brockwell (1988) 研究了一般的双线性模型.双线性模型的性质（如平稳性条件) 
通常通过两个步骤导出： （ a ) 把模型写成状态空间 形式; （ b ) 利用状态转移方程把状 
态表示成过去的新息与随机系数向量的乘积. (4.4) 式中的双线性模型的特殊推广 
形式是有条件异方差性的.例如，考虑模型 

a 

x t = ^2 fliat-ia t + a t , (4.5) 

i=l 

其中是一个白噪声序列 . a :, 的前两阶条件矩为 

EWt’i) = p ， Var^tlFt-j) = ^1 + 4 ， 

这与第 3 章中的随机系数自回归 ( RCA ) 模型或条件异方差 ARMA ( CHAKMA ) 模 
型的前两阶矩相似. 

例 4 .1 考虑 CHSF 等权重指数从1926年1月至1997年12月的月简单收益率， 
共86 4 个观 察值. 记此序列为凡_ 的样本偏自相关函数 ( PACF ) 在间隔为1和 
3处是显著的，而的样本 PACF 显示条件异方差可能依赖于过去的三个新息. 
因此，我们对此序列采用特殊的双线性 模型： 

Rt = y>-\- + 03^t-3 十 （1 + /3iat~i + ^at-2 + 

假定〜的条件分布为正态分布，我们用条件最大似然法得到所拟合的模型 

Rt = 0.014+0.160i?f_i. —0.104/?t_3+(l+0.337at — 1 — 0.022at_2—0.601at_3)ot, (4.6) 

其中# = 0.005 2,各参数估计的标准差依次分别为 0.003, 0.026, 0.018, 0.083, 0.084 
和 0.079. 只有 a t _ 2 的系数的估计值是不显著的.定义此模型的残差序列为 

. Rt- 0.014 - OlgO^-H- 0.014R, 一 3 
° l ~ 1 +0.337o t _i - 0.022a t _ 2 - 0_601 心 _ 3 ’ 
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其中，对 < 彡 3，a t = 0. a t 的样本 ACF 显示没有显著的序列相关性，但屯不是独 
立的序列，因为平方序列的有显著的序列相关性.模型 （4.6) 的有效性需要进一步 
研究.为了作比较，我们再对此月简单收益率序列考虑一个 ARCH ⑶模型.得到 


Rt = 0.013 + 0.222/^_, - 0.140^_ 3 十 

of = 0.002 十0.168^_! + 0-000 01a^_ 2 + 0.274a?_ 3 , 

其中除 a?_ 2 的系数外，其他所有估计值都是高度显著的.标准化的残差序列和它 
的平方序列都没有显著的序列相关性，这表示所建的 ARCH(3) 模型对数据是充分 
的.模型 （4.6) 和 (4.7) 有_相似，但后者似乎能更好地拟合数据. 

4.1.2 门限自回归模型 


此模型出现的动因是实际中经常观察到的几种非线性特征，例如一个过程在上 
升和下降阶段的非对称性.它用分段线性模型来得到条件均值更好的逼近.然而， 
与传统的分段线性模型不同 的是： 传统的模型允许模型的变化发生在时间空间上， 
而 TAR 模型则利用门限空间来改进线性逼近.我们从简单的两体制 AR(1) 模型开 


始 


{ —1.5x t _i -fa t , 若 x t -i < 0, 
0.5x t _i + 叱， 若 x t _i ^ 0, 


(4.8) 


其中〜 独立同分布服从于 AT(0,1). 这里，门限变量为 xt-x, 延迟是〗，门限是0.图 
4-1 所示的是的 200 个模拟观察值的时间图.图中加入的一条恒为 0 的水平线. 
这反映出 TAR 模型的几个特征.第 一 ， 尽管在第一个体制中的系数是 - 1.5, 过程 
还是几何遍历 （geometrioiUy ergudk) 和平稳的.事实上，模型 （ 4.8) 是几何遍历的 
充要条件是政)< 1,0产< 1 < 1,其中0; 0 是体制 * •的 AR 系数，可参 

见 Petruccelli 和 Woolford (1984), Chen 和 Tsay (1991). 遍历性在时间序列分析中 

是一个重要的概念.例如，证明样本均值 i = Y.xt/T 收敛于&的均值的统计理 
论称为遍历定理 （ergodic theorem). 它被认为是与独立同分布情形的中心极限定理 
同等重要的理论第一，该序列显示出非对称的上升和下降 态势： 若是负的， 
则 A 将转向一个正值，因为这时有负的膨胀系数 -1.5; 然而，若是正的，则 
经过几个时间指标后序列变为负值.从而,的时间图显示出体制2比体制1有更 
多的观察值，并且 a 序列取负值时它包含有很大的向上跳跃.因此，此序列不是时 
间可逆的 （time^reveraible). 第三，此模型没有常数项.但 E(x t ) 不为 0. 图中所示的 
这个具体实现的样本均值是 0.61. 标准差为 0.07. 一般地， E(a：t) 是两个体制下的条 
件均值的加权平均.通常不是0,而每个体制的权重就是在平稳分布下^处于该体 
制的概率.要使 TAR 模型的均值为0,需要在有的体制中有非零常数项.这一点与 
平稳线性模型有很大不同.在平稳线性模型中非零常数项的存在意味着^的均值 
不为零. 
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称一个时间序列:服从门限为 a : t _ d 的 A : 个体制的自激发 ( self - exciting)TAR 
( SETAR ) 模型，如果它满足 

工 * =碑)十冲); ct-i -+ 0^\ 当< » t-d < 7 j 时， (4.9) 

其中 A : 和《/ 是正整数， _?• = 1，…， fc . 7 j 是满足 -oo = 7 o < 7 i < * * * < lk-i < 7 fc = 
OO 的实数，上角标 ( i ) 用来表示体制，恤是均值为0 、方差为 <7 】的独立同分布序 
列，且对不同的 J 是相互独立的.参数 rf 称为延迟参数 . ％称为门限.这里，对不同 
的体制， AR 模型是不同的，否则可减少体制的个数. （4.9) 式的自激发 TAR 模型是 
在门限空间中的分段线性 AR 模型.它与回归分析中通常的分段线件模型的思想 
相似，只是那里模型的变化是以取得观察值的时间为顺序的.只要 k>1, SKTAR 
模型就是非线性的. 

一般的 SETAR 的性质难以得到，一些特殊情形的性质可以在 Tong (1990), 
Chan (1993), Chan 和 Taay (1998) 以及这几个文献的参考文献中看到.近年來 
人们对 TAR 模型和它们的应用越来越感兴趣，具体可参见 Hansen (1997), Tsay 
(1998) 和 Montgomery 等 (1998). Tsay (1989) 提出了一个对一元 SETAR 检验和 
建模的方法. (4.9) 式的 SETAR 模型可以推广，只需要利用关于 Ft.i 可测的门限 
变量 A (也即，它是 F t _! 屮元素的函数).这里土要要求力是平稳的，有在实直线 
的紧子集上连续的分布函数，并且 2*^ 在 i 时刻是已知的.这样的推广模型称为 
开环 (open-loop)TAR 模型. 

例 4.2 为 f 说明 TAR 模型的应用，考虑美国从1948年1月到2004年3月的 
月平民失业率，共有675个观测.数据已经经过季节调整并且以百分比的形式给出. 
数据来自劳工部劳动统计局，图 4-2 给出了数据的时间图.该图显示出数据的两个 
主要特征.第一，总的来看失业率有一个缓慢上升的 趋势； 第二，失业率波动较大， 
倾向于迅速上升，然后迅速下降.因此，该序列不是时间逆转的，也不是单位根平 





稳的. 



图冬 2 从 1948 年 1 月到 2004 年 3 月的美国月失业率的 N 间图，数据已经经过季竹调整 


由于样本自相关函数衰减缓慢，所以在分析中我们使用月失业率序列的一 
阶差分序列 y t =( l - B ) u t . 我们得到如下的一元 ARIMA 模型 

(1 - 1.18 B + 0.3 ⑽ 2 )(1 — 0.51 i ^ l 2 ) y t = (1 - 1.17 J 5 + 0.48 丑 2 )(1 - 0.82 J 3 12 ) a t , (410) 

其中乂 = 0.190, 所有的系数在5%的水平下都是显著的，其中 AR (2) 系数的比 
最小为 -2.01. 模型 (4.10) 的残差给出 0(12) = 9.9, Q (24) = 22.4, 这表明所拟合模 
型对数据序列相关性的描述是充分的.注意到尽管数据已经经过手节调整，然而季 
节 AR 和 MA 系数都是髙度显著的，标准误差分别为 0.05 和 0.046. 因此，季节调 
整的充分性值得进一步研究. 

为了给数据中的非线性性建模，我们应用 TAR 模型，并得到如下模型 
y t = [ 0069 ^-2+ 0 - 153 y «-3+0.106 t / t _4-0.181 t / f - i 2+ ai < , 若讲 - i <0.1， 

\ 0.401 y t _2 + 0.208|/ t _3 — 0.139 y t _ i 2 + a 2 t , 若 > 0.1， 4 ^ 

其中 a “的标准误差分别为0 I 83 和 0.223, 体制1中 AR 系数的标准误差分别为 
0 048, 0.044, 0.043 和 0.038, 而休制2中 AR 系数的标准误差分别为 0.057, 0.060 
和 0.079. 休制1和体制 2 中的数据点分别为 4 M 和 240. 模型 (4.11) 的残差没有 
显示出任何序列相关性.基于所拟合的 TAR 模型，当日欠业率的变化超过0.1%的, 
数据中的动态依赖关系也变得更强一些.这是可以理解的，因为失业率的大的丄升 
是美国经济变弱的预示，政策制定者应该更倾向丁釆取措施来帮助经济，这反过来 
又会影响失业率序列的动态 关系.因此. 模型 (4.11) 能够描述美国失业率的时变动 
态性. 

模型 （4.10) 的 MA 表不是 

r / f { B ) « 1 + 0.01 B + 0.15 J 5 2 + 0.18 S 3 + 0.16 丑 4 + … . 
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1970 198U 1990 2000 

年 

图4>3 IBM 股票从1962年7月3日至2003年12月31日的日对数收益率的时间图 

如采应用第3章屮的 GARCH 模型，对此序列我们得到如下的 AK (2)- GA 11 CH 
(1,1) 模型 

r t = 0.062 - 0.024 r t _ 2 + ， a t = a t £ti 
a\ = 0.037 + 0.077 a?_ l + 

其屮 n 是对数收益率，是均值为0、方差为1的髙斯白噪声序列.均值力差 
中参数的标准误差分别是 G .015 和 0.010, 波动举方程中的标准误差分别是 0.004, 
0.003 和 0.003. 所有的系数估计都是卨度显著的.标准化残差的 Ljung - Box 统计量 
为 Q (10)=5.19(0.88), Q (20)=24.38(0.23), 其中括号里的数是 p 值.对标准化残差的 
平方， Q (10)=11.67(0.31), Q (20)=18.25(0.57). 模型在刻画数据的序列相关性和条件 
异方差性方面是充分的.但由模型 (4.12) 得到的无条件均值为 0.060, 要比样本均 
值 0.039 大一些，这显示该模型可能错了. 

下面应用第3章的 TGARCH 模型得到 


因此项在模型 (4.11) 中没有出现也并不奇怪. 

如同第3章中所提到的那样，门限模型在金融中的一个重要应用是处理波动 
率对正、负收益率的不对称响应.此模型也可用来研究指数期货和现金兑换价格中 
的套利交易，见第8章中关于多元时间序列的讨论.这里我们只把注意力放在波动 
率建模上，并介绍另外一种对 TGARCH 模型进行参数化的方法.在一些应用中， 
这种新的一般 TGARCH 模型要比第3章中的 GJR 模型要好. 

例 4.3 我们考虑 IBM 股票的日对数收益率，从 1962 年 7 月 3 口到 2003 年 12 
月 31 日共 U ) 446 个观察值，以百分比形式给出并己包含分红.图 4~3 所示的是此 
序列的时间图.该序列是本书所分析的较长的收益率序列之一.在后期的波动率看 
上去要大一些.由于分析中我们所用的是一般 TGAHCH 模型，所以该例中我们用 
SCA 包进彳了估计. 



Gloa) 
I J 
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rt = 0.014 — 0.028r t _2 + at, at = artSu 

of = 0.075 + 0.081P t _!at, + O.l^N^a^ 4 - 0.863<r t 2 , (4 ' 13) 

其中忾 ―丨 = 1 - Nh 是 _ 取负值时的指示变量，即满足若< 0, 

则 N t ^ = 1,否则 h = 0. 均值方程中参数估计的标准误差分别为 0.013 和 
0.009; 波动率方程中参数估计的标准误差分别为 0.007, 0.008, 0.010 和 0.01() .除了 
^值方程中常数项的估计外，所有其他的估计都是显著的 .记屯 为模型 （4.13) 的 
标准化的残差•对 {5*}, 我们有 Q ( 10)=2.47(0.99), Q (20)=25.90(0.17); 对{赶}有 
Q (10)=97.07(0.00), Q (20)=170.3(0.00). 模型不能很好地刻画数据的条件异方差性. 

为了提高对波动率中非对称响应建模的灵活性，可用 TAR 模铟的思想来改进 
此 模型. 具体地,我们对该序列用一个 AR (2 )-TAR GARCH (1 ? 1) 模型，得到 

?> = 0.033 — 0,023tv~2 + ai = u 必， 

= 0.075 -f 0.041a?_j + 0.903a2_j + (0.030#^ + 

其中 U (4.13) 式中有定义.模型 （4.14) 中的所有估计在1%的水平下都是显 
著地不同于零的•令屯为模型 (4.14) 的标准化的残差.对 {a t }, 我们有 Q (10) = 
6.09(0.81), Q (20) = 25.29(0.19); 对{句}有 Q (10)=13.54(0.20), Q (20)=19.56(0.49). 
因此，模型 (4.14) 能充分地刻画该例中所考虑的 IBM 股票日对数收益率的序列相 
关性和条件异方差性•模型 (4.14) 中收益率的无条件均值是 0.033, 比模型 （4.12) 和 
(4.13) 中收益率的无条件均值更靠近样本均值 0.039. 比较所拟合的两个 TGARCH 
模型，我们看到日 IBM 股票的波动率中的非对称性要比在 GJR 模型中更为强烈. 
具体地， of — 的系数也依赖于的符号.注意到模型 （4.14) 可以进一步改进，我 
们可以增加限制要求当< 0时， (7^, 和的系数之和为 1. 

注释估计 AR (2)- TAR - GARCH (1,1) 模赉的 RATS 程序将在本章附录 A 中 
给出.结果可能与文中由 SCA 给出的结果略有不同. □ 

4.1.3 平滑转移 AR ( STAR ) 模型 

对 SETAR 模型的一种批评是它的条件均值方程不是连续的.门限是条 
件均值 函数糾 的不连续点.鉴于这种批评，人们提出了平滑的 TAR 模型，可参见 
Clmri 和 Tong (1986)、 Terasvirta (1994) 以及这两篇论文的参考文献.称时间序列 
{ A } 服从两个体制的 STAR ( p ) 模型，如果 { a :,} 满足 

= cu 4- ^ + F ( j ( tl 十 5 Z 也，十 ， (4.15) 

其屮 d 是延迟参数，△和 . s 是模型转移的平移参数和尺度参数,是一个平滑的 
转移 函数. 在实际中， F (.) 经常假定为三种形式 之一： Logistic 函数、指数函数或一 
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个累积分布函数.由 （4.15) 式, STAR 模型的条件均值为如下两个方稈的加权线忡 
组合： 

p 

A*it = Co -t- <f>o,iXt-i, 

t=l 

p 

^2t = (Co + Cl) + ^2 (0O,i+01 t t)^-4- 
*=1 

权重由 以一个连续的方式决定.上述两个方程也决定了 STAR 模 

型的性质.例如 STAR 模型平稳性的必要条件是这两个 AR 多项式的零点都在单 
位圆外. STAR 的优点是条件均值函数是可微的，但经验表明其中的参数△和 s 是 
难以估计的.特别地,大多数实证研究表明△和 . s 估计的标准差相 当大， 比大致 
为1，见 Tera 8 virta (1994). 这种不确定性会导致在解释所估计出的模型时复杂性较 
大. 

例 4.4 我们用 3M (Minnesota Mining and Manufacturing) 公司股票从 1946 年 2 
月到 1997 年 12 月的月简单收益率来解释 STAR 模型的应用.若考虑一个 ARCH 
模型，我们得到如下的 ARCH(2) 模型： 

Rt = 0.014 -ha t ,a t = a t e t , a} = 0.003 + 0.1U8af_ x + 0.151a?_ 2 , (4,16) 

其中各估计值的标准差分别为 0.002, 0.000 3, 0.045 和 0.058. 如同前面讨论的，这 
样的 ARCH 模型不能描述股票波动率对正、负“扰动”的不对称反应.用 STAR 模 
型可以克服这一困难.把 STAR 模型应用干 3 M 股票的月收益率，我们得到 


Ri = 0.017 十 at = crtEty 


tr} = (0.002 4 - 0.256a2_ t + 0.141a?_ 2 ) + 


0.002 - 0.314a ?—1 
1 + exp(-l 000a t -i) ’ 


(4.17) 


其中均值方程中常数项的标准差为 0.002, 而波动率方程中的各估计值的标准差分 
别为 0.000 3, 0.092, 0.056, 0.001 和 0.102. 为了简化估计，转移函数的尺度参数 
1000是事先给定的.这个模型为对正负“扰动”反应的不对称件提供了支持.对绝 
对值很大的负 at-u 波动率模型近似为 ARCH (2) 模型： 


a\ = U.D02+ 0.2564」+ O.Ula 2 t _ 2 . 


对很大的正波动率过程近似如下 ARCH (2) 模型: 


of = 0.005 - 0.0580^! + 0.141a?_ 2 . 

此模型中的系数为负，这与直观相违，但绝对值很小.事实上，对较大的正扰 
动 a t _ l5 ARCH 效应较弱，即使参数估计仍然是统计显著的.计算时所用的 RATS 
程序将在附录 A 中给出. 
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4.1.4 马尔可夫转换模型 

在非线性时间序列分析中使用概率转移的思想在 To U g (1983) 中有讨论.利用 
类似的想法，但强调 个 经济量在各个状态之间的非周期转移. Hamilton (1989) 考 
虑了马尔可夫转换自回归 ( MSA ) 模型.这里转移由一个隐含的两个状态马尔可夫 
链驱动.称时间序列服从 MSA 模型.如果满足 

P 

ci + ^2 + a it - 如果 . s t = 1， 

T (4.18) 

C 2 + + a 2 t , 如果 = 2, 

*=i 

其中 s , 是在 {1,2} 中取值的马尔可夫链,转移概率为 

= 2|s t _i = 1) = w lf P(s t = l|s t -i = 2) = u ； 2 . 

新息序列 {a u }, {a. 2t } 都是均值为零、方差有限的独立同分布随机变量序列，并且 
两序列之间是相互独立的.较小的叫意味着模型在状态 i 上停留更长的时间.事 
实上，1/叫是过程停留在状态 i 上的期望持续时间长度.由定义可见， MSA 模型是 
利用一个隐含的马尔可夫链来掌握从一个条件均值函数到另一个条件均值函数的 
转移. 这与 SETAR 模型不同.在 SETAR 模型中转移由一个具体的延迟变量来决 
定.总之， SETAH 模型以一个确定的方案来掌握模型的转移，而 MSA 以一个随机 
体制来掌握模型的转移.在实际中，由于状态的随机性.在 MSA 模型中不能确定 
属于哪一个状态.当样本容量很大时，可利用一些滤波方法来对的状态作出 
推断 • 然而对 SETAR 模型，只要 x t — d 被观察到了，: r t 的体制就已知了.这个差别 
在预测时有重要的实际 涵义. 例如， MSA 模型的预测总是由各个状态下的子模型产 
生的预测的线性组合，但对 SETAR 模型. -旦 x t — d 被观察到了，其预测就是单个 
体制下的预测，而如果预测步长超过延迟 SETAR 的预测也是各个体制下预测的 
线性组合. MSA 模型的估计要比其他模型困难得多，因为状态不是可直接观察的. 
HamULoii (1990) 釆用 EM 算法来估 MSA 模型 • EM 算法是一种在取期望和取最 
大值之间重复迭代的统计方法. McCuUoch 和 Tsay (1994) 考虑用马尔可夫链蒙特 
卡罗 ( MGMC ) 方法佔计一般的 MSA 模型. 我们在第12章将讨论 MCMC 方法. 

McCulloch 和 Tsay (1993) 把 (4.18) 式的 MSA 模型进行/推广，允许转移概 
率 A 和 u ; 2 为 Logistic 的或者是概率值的，并且在 M 时刻可获得一些解释变量 
的凼数 • Chen , McCulloch 和 Tsay (1997) 用马尔可夫转换的思想作为工具来对非 
眹套的非线性时间序列模型进行比较和选取（例如，比较双线性模型和 SETAR 模 
型). 每一个候选模型用一个状态来表示.这种选择模型的方法是贝叶斯分布中常 
用的机会比 (odds ratio ) 方法的推广.另外， MSA 模型可以容易地推广到多个状态 
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(多于两个状态）的情形，但计算暈将迅速增加.对计暈经济学中关于马尔可夫转换 
模型更多的讨论，请参见 Hamilton (1994) 的第 M 章 

例 4.5 考虑美国的实际国民总产值 ( GNP ) 的季度增长率，时间段是 1947 年第 
二手度到 1991 年的第一季度，以百分比形式给出.图 4~4 是经过手节调节的数据的 
时间图.其中有一条水平的零增长线.可见大多数增长率是正的.这个序列在经济 
时间序列的非线性分析中被广泛应用. Tiao 和 Taay (1994) 以及 Potter (1995) 用 
TAR 模型， Hamilton (1989) 以及 McCulloch 和 Tsay (1994) 用马尔可夫转换模型 
都研究过此序列. 

采用当 p = 4时 （4.18) 式的 MSA 模型，用 MCMC 方法（第12章中将 I 寸论)， 
McCuiloch 和 Tsay (1994) 得到的估计列在表 tl 中. 



年 

m 4-4 美国实际 GNP 季度增长率的时间图，时间段为 1947. II 1991. I . 数据经过季节 
性调节，并以百分比形式给出 


表 4*1 对美国实际 GNP 的季度蝤长率（经季节调节）运用 p = 4时的 MSA 横型的估计 
结果 • 


参数 

Ci 

♦1 

<t>2 

必3 

4>4 



估计 

0.909 

0.202 

0.265 

状态1 
0.029 

0.126 

-o.no 

0.816 

0.118 

标准差 

0.113 

0.126 

0.103 

0.109 

0.125 

0.053 

估计 

0.420 

0.216 

状态2 
0.628 

-0.073 

0.364 

-0.097 

1.017 

0.286 

0.064 

标准衮 

0.314 

0.347 

0.377 

0.404 

0.293 


a 估计值和它们的标准差是5 000次迭代的 Gibbs 抽样的后验均值和标准差. 


结果中有几点有趣的发现.第一 1状态1下边缘模型的平均增长率为 0.909/(1- 
0.265-0.029 + 0.126 + 0.11) = 0.965,状态2下边缘模型的平均增长率为 - 0.42/(1- 
0.216 - 0.628 + 0.073 + 0.097) = — 1.288. 这样.状态1对应有正增长率的季度或 
膨胀期.状态2对应有负增长率的季度或紧缩期.第二，状态2下参数估计的相对 
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较大的标准差反应出在这个状态的观察值较少，这一点可从图4~4中看出，较少的 
季度具有负增长率.第三，对不同的状态，转移概率会不同，走出紧缩期的概率较大 
(0.286 对 0.118). 第四，把1/叫当作停留在状态 i 的平均持续时间长度，我们看到 
紧缩期和膨胀期的平均长度分别大约是 3.69 和 11.31 季度.这样，平均起来，美国 
经济的紧缩大致持续1年，而膨胀大致持续 3 年.最后，两个状态下 t ( _ 2 的 AR 系 
数的估计值差别很大，显示出美国经济的动态规律在紧缩期和膨胀期是不同的. 


4.1.5 非参数方法 

在一些金融应用中，我们可能没有足够的信息来确定两个变量 K 和 X 之间的 
非线性结构.我们希望可以在其他应用中利用计算设备和计算方法上的进展来探 
索 V 与 X 之间的函数关系.这就要用到非参数的方法和技巧.然而，非参数方法 
的运用不是没有代价的.它们髙度地依赖于数据并容易导致过度拟合 （ OVei fiUii lg ). 
本节的目的是要介绍金融应用中的一些非参数方枕和利用非参数方法的些非线 
性 模型. 所 i •寸论的非参数方法包括核回归 （Kernel regression )、 局部最小二乘佔计 
和神经网络. 

非参数方法的本质是“平滑” ( smoothing ). 考虑两个金融变量 y 和 X . 满足 

= (4.19) 


其中 m () 是任意光滑但未知的函数， {〜} 是白噪声序列.我们想由数据 i 估计非线 
性函数 m (-). 为了简单起见，考虑 X - x 这个特定的时候 m ㈠ 的估计问题，也就 
是 m ( a ：) 的估汁问题.假定对应 X = x , 我们有重复独立的观察 VI ，…， yr . 则数据 
变为 


Vt = m(aO +a tl t = 1， • •. ， r. 

对数据取甲均得到 

由大数定律，当 r 趋于 oo 时，“扰动”的平均趋于0,故 S ^ 讲 / T 是 m ( rr ) 的一 

个相合估计 . &提供了 m (： r ) 的个相合估汁，或者说扰动均趋于零这个事实 
显示出了 T 滑的作用. 

在金融时间序列中，在 X = a : 点我们不能有重复的观察.所观察到的是 
{( yt ， 工 t )},* = l , …， r . 但如果函数 m ㈠ 是允分光滑的，对应于 x t m x 的那些 
r t 的值仍然可以提供 m ( x ) 的较为精确的近似.向对应于远离: r 的 A ：, 的那些 
的值就不能提供对 m { x ) 的较好近 似. 作为折中，估计 m ( x ) 时人们用的加权平 
均来代替简单的平均.权重应 满足： 对应于 t 附近的的那些 V ；所给权重较大， 




而对应于远离: r 的不的 V ；所给权重 较小. 数学表达上，对给定: r , m ( x ) 的估计为 

1 丁 

M^) = m(x)y t , (4.20) 

1 t=i 

其中权重购 (: c ) 满足：对应于 : r 附近的 x t 的队 所给 w t ( x ) 较大，对应于 远离: r 的 
A 的讲 所给的 tv t ( x ) 较小在（ 4 . 2 0) 中，我们假定所有权重之和为 r . 也可以把 
1/ T 看作权重的一部分，而权重之和为 1. 

由（ 4 . 2 0) 式， rh(x) 只是一 ■个 局部加权平均 (local weighted average), 其中权重 
由两个因素决定.第一个因素是距离（別与 I 之间的距 离)； 第二个因素是对给定 
的距离权重的分配.不同的距离度量方法和不同的权重分配将产生不同的非参数 
方法. 下面讨论通常使用的核回归和局部线性回归方法. 

核回归 

核回归也许是最常用的平滑非参数回归方法.这时的权軍由一个核函数决定 
典型的核函数是概率密度函数，一般记为 K ( x ), 满足 


if(x) > 0, J K(z)dz = 1. 

为了增强在距离度垦上的灵活性，人们往往用一个变量 h > Q 来对核凼数重新尺度 
化 

K h(x) = ^K(x/h), J K h (z)dz = 1, (4.21) 

这里的 & 称为窗宽 （ hamlwidth ). 权函数定义为 

= (422) 

其中分母是一个标准化常数，它使得平滑能适应于变量 X 的局部强度而且权重之 
和为1.把 (4.22) 式代入平滑公式（ 4 . 2 0)中，我们得到著名的 Nadamya - Watsoi ! 核 
估计： 

蜂) 香“咖 夸：:： ， ( 4 .叫 

具体可参见 Nadaraya(l 964 ) 和 Watson( 1964 ). 在实际中，有很多核函数可供选择. 
然而，从理论和实际应用的两个角度考虑，只有几种核函数是常用的，其中 包括髙 
斯核函数 


Kh ^ x ) = 


▲ CXP (-.) 


和 Epanechnikov 核 (Epanechnikov( 1969)) 


灿)=钟身⑽ 




148 第 4 幸非线性模型及其应用 


其中 /( A ) 是一个示性函 数：若 4成立则 1( A ) = 1,否则/(⑷= (1 图所示的 
是当 h = 1时高斯核和 Epaneclmikov 核的图像. 



为 f 理解窗宽所起的作用，我们米评价一些带 Epanechnikov 核的 Nadaraya - 
Watscm 估计在观察值上的表现.考虑两个极端 情形： 第一，若 /i — 0,则 


m(xt) —♦ 


K h {0)y t 

K h {0) 


这表明很小的 / i 会重现数据 本身； 第二，若 A — + oo , 则 


rh ( xt ) — ^ 


E.L ^(Q)vt 
eL 心⑼ 



Vt - y, 


说明很大的 / i . 会导致过度平滑曲线 样本均值.一般地 ： 窗宽^的作用如下： 

当 h 很小时，权重只集中在每个邻域内的少数观察 值上； 当 h 很大时，权重会 
分散到 A 的较大邻域内.总之， h 的选择在核回归分析中起着重要作用.这就是核 
回归屮有名的窗宽选择问题. 

窗宽的选择 

窗宽的选择有几种方法，可参见 Hardle (1990) 以及 Fan 和 Yao (2003). 第一 
种方法是塞入法 （ plug-in method ), 该方法基于比较平滑的核函数的积和均方误差 
( MTSE ) 的渐近展开.考虑 


MISE = E 



[ m ( a :) — m ( x )] 2 dz . 


其中 m (.) 是真实函数. MISE 中的量 E [ m ( a ;)- m ( a ；)] 2 是对在 x 点的估计值也⑷的 
均方误差 ( MSE ) 的一个点的度量.在某些正则性条件下，我们可通过最小化 MISE 
得到最优窗宽.最优窗宽一般依赖于待估的未知量.这些未知量必须由数据用某种 
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初步平滑去估计.要得到合理的最优窗宽估计，需要多步 叠代. 在实际应用中，初步 
平滑的选择是一个问题 . Fan 和 Yao(2003) 给山了个正态参考窗宽选择 

/i( t [ 1 施 r -" 5 ， 高斯核， 

P 1 2.34s ! T _1 / 5 ，Epanechnikov 核， 

其中 《 是 Y 稳独立随机变量的样本标准差. 

窗宽选择的第二种方法是漏掉一个观测的交叉验证 （ cms ^ validation ). 第一步, 
去除一个观测 ( Xj , yj ). 用剩下的 7 -1 个数据点得到如下 的在々 点的 平滑： 

~ tjtj 

它是吣的个估 il 值，其中权重吣 h) 的和为:/，- 1. 第二步，对 j = ，r 都 

做第一步，并且定义函数 

1 T 

CV W = f 5Z [yj-^hAxj^wixj), 

J =1 

其中撕(.）是一个非负的权重函数.满足 f ； W ( Xj ) = T . 如果必要.它可用来降低 

边界点上的权重.因为对于接近边畀的点\ k 常只有很少数的数据点与之相邻，所 
以有降低它们权重的必要•函数 CV ( h ) 称为交叉验证 函数. 这是因为它验证了平滑 
函数预测 { y t ) Li 的 能力. 我们可以通过最小化 cr (.) 来选择窗宽 • 

局部线性回归法 

假定 (4-19) 式中 m (.) 的二阶导数存在，并且在点; T 处连续,这里: r 是 m (.) 支 
撐中的一个给定的点.记能获得的数据为 {( y u x t )} T = i . 非参数回归中的局部线性 
回归法就是要找出 a 和6,使下式达最小值： 

T 

厶(《， ^)=^ 2 [ yt - a - b(x - x t )] 2 K h ( x - x t ) } (4.24) 

1=1 

其中欠以.）是 (4.21) 式中的核函数，/ I 是窗宽.记 a 的估计值为 a ， 则 m ( x ) 的估计 
定义为 a . 在实际屮，假定: T 是独立随机变量的观 测值. 估计值6可以作为对 m (.) 
的一阶导数在: r 点取值的估计. 

在最小一乘的理论卜， (4.24) 式是一个加权最小二乘问题，并且我们可以推导 
出 a 的显 式解. 具体地，求 L ( a ,6) 关于 a 和6的偏导数，然后令偏导数等于0,我 
们得到有两个未知数的两个 方程： 

r t t 

x t ) y t ^ a ^ Khix - Xt )^ x t ) K h { x - x t \ 

t=i 
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T T T 

y f (ar — Xt)Kh(x - Xt) = fl [ (x — Xt)Kh(x — ®*) + 6^(1 — xt) 2 Kh(x - it). 
e=i *=i t=1 

定义 . 


s T j = ^2 Kh ^ x ~ x t )( x ~ x t) l y ^ = 0,1,2. 


上述两个方程变为 


«r,o s Tt i 


a 

• ST,1 8T.2 


b 


K h {x - x t )y t 
t=\ 

T 

E (i - x t )K h {x- x t )y t 


从而，我们有 

. . ， T ， 2]CLl K h{^ — ^yt - ST,1 ELl - x t) K ^ X - X t)Vt 
ST,0ST r 2 - Sr,i 

h 式的分子和分母可进一步简化 

T T 

s T , 2 ^K h (x- x t )y t - ST.I ^2 {X - x t )Kh(x- x t )y t 

t=l t=l 

T 

=y^\Kh(x - xt)(sr .2 - (x — it) s r,i )]l/t, 

(=1 

T T 

»T,0ST,2 - Sr.l = Y1 K h( x ~ x t)»T,2 - ( 工 - - 

e=i 4=1 

T 

= ^2 Kh ^ x ~ Xt )[ s T,2 — (: - A).»T,ll. 


a = 




综合之,我们有 
其中叫 定义为 

tjJt — Kh(x - xt)[«r,2 — {x- «t)sr,i]- 

在实际应用中，为了避免分母为0的情况，我们使用 m ( a ：) 的如下 估计: 


蜂 

注意到 (4.26) 式有一个很好的特性.就是 权重⑷ 满足 


(4-25) 


(4.26) 


T 

〉: (x — Xt )u>t = 0. 
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另夕卜.如果只假定 （4.19) 式中 m (.) 有一阶导数，通过求 

T 

E (vt - a) 2 K h {x-x t ) 
e=i 

的最小值点，可得到前面介绍过的 Nadaraya Watson 估计. 一 般地，如果假定 m ( x ) 
有有界的 A ： 阶导数.则可用一个 （ A: 1) 次多项式代替 （ 4.24) 式中的线性多项式. 
我们把 (4.26) 式中的估计称为局部线性回归 平滑. Fan(1993) 证明了在某些正则条 
什下局部线性回归有某些重要的抽样性质.窗宽的选择可以用与前面讨论过的相 
同的方法得到. 

时间序列的应用 

在时间序列分析中，解释变量通常是序列的延迟值.考虑单个解释变量的简单 
情形.这时模型 (4.19) 变成 

Xt — + 04. 

可以直接应用前面所讨论过的核回归和局部线性回归方法.当有多个解释变置存 
在时，需要作一些修改后再用非参数力法.对核回归，我们可以用多兀核函数，如具 
有给定协力差矩阵的多元正态密度函数 

其中 P 是解释变量的个数， S 是事先给定的正定矩阵.也可以用一元核函数的乘积 
作为多元核函数.例如 

^)=n^(-SH|l|<i). 

这一方法比较简单,但忽略了解释变量之间的关系. 

例 4 . 6 为了说明非参数方法在金融中的应用，考虑二级市场上从 1970 年到 1997 
年 3 个月期国库券的周利蜜，共1 46 0个观测.数据是从圣 • 路易斯联邦储备银行 
(Federal Reserve Bank of St Louis) 得到的，图 4~6 给出了数据的时间图.这些序列 
在文献中经常用到.作为用直接观测数据估计随机扩散方程的例子，读者可参见第 
6章的参考文献.这里我们考虑一个简单 模型： 

yt = + 

其中是 3 个月期国库券利率，讲 = ar t - x t _ lt a ; t 是标准布朗运动， / x (.) 和 a (.) 
是的光滑函数.应用 S - Plus 中局部光滑函数 lowess 可得到 /i(.) 和 tr (.) 的非 
参数估计，详细可参见 Cleveland (1979). 为简单起见，我们用|讲| 作为❼ 波动率的 
代表. 




152 第 4 章非线性模型及其应用 



图 4>6 二级市场上从 1970 年到 1997 年 3 个月期国库券的周利率的时间图 

对于上述所考虑的简单模型,是给定:时讲的条件均值，即 
=與讲 ㈨ ^).图 4~7 a 给出了 y ⑴对的散点图.该图还包含由 S - Plus 中的 
lowess 所得到的的局部平滑估计.估计本质上是 0. 然而，为了更好地理 
解该估计，图 4-7 b 给出了更精细刻度下的估计值我们发现一个很有趣的 
现象:当的值很小时, H ( x t ^) 是 正的;而当: cm 的值很大时， Abt - O 变成了负 


⑷ («) 


0.02-t 



<t-l) *(i-l) 


图 4~7 通过局部平滑方法所给出的 3 个月期国库券的周利率的条件均值和波动率的估计： 
(a ) 识对 a ：*—!， 其中 y t = x t - x t -u x t 是利率； （ b) /i(act-i) 的估计； （ c) | 讲 | 对 Xt-i ； 
(d) cr(xi-i ) 的估计 
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的.这与常识相 一致： 即当利率很高时，期望其 下降； 而当利宇很低时又期望其上 
升图 4~7 c 给出了 | y ( OI 对 m 的散点图，估计由 lowcss 给出.该图进一 
步证实了，利宇越高，波动率越大.图 4~7 d 给出了更精细刻度下的估计值 aixt - i ). 
可以很清楚地看到波动率是:的增函数，当 arty 达到10%时斜率在增加.这 
个例子说明了简单的非参数方法在理解金融时间序列的动态结构时很有用. 

例 4.6 中所用到的 S - plus 命令 

> zl=matrix(scan(file='w-3mtbs7097.txt , ),4) 

> x=zl[4,1:1460]/100 

> y»(zl 『 4,2:1461]-zl[4,1:14601 )/100 

> par(mfcol=c( 2 , 2 )) 

> plot(x,y,pch= , * , ,xlab= , x(t-l) , < ylab=*y(t)') 

> lines(lowess(x,y)) 

> title(main-* (a) y(t) vs x(t-l)') 

> fit=lowess(x,y) 

> plot(fit$x,fit$y,xlab= , x(t-l)»,ylab= ， mu ，， type= , l , , 

+ ylim= C(-.002,.002)) 

> title(main* # (b) Estimate of mu{.) *) 

> plot(x,abs(y),pch=***,xlab= ， x(t-l 广 ,ylab=*abs(y)M 

> lines(lowess(x,abs(y))) 

^ title(main= , (c) abs(y) vs x(t-l)*) 

> fit2=lowess(x,abs(y)) 

=* Plot (fit2$x, f it2$y, type=» l*,xlab=*x(t-l) ^.ylab^* sigma* , 

+ ylim* c(0,.01)) 

> title(main*, 《 d) Estimate of sigma(.) # ) 

下面介绍几个由非参数方法导出的非线性时间序列模型. 

4.1.6 函数系数 AR 模型 

非参数方法的新近成果使得研究人员在提出非线性模型时可以放松参数型的 
约束.有些情形下，非参数方法用来对数据进行初步研究，以帮助选择一个参数型非 
线性模型. Chen 和 Tsay (1993 a ) 采用这种方法，提出函数系数自回归 ( functional - 
coefficient autoregressive , FAR ) 模期 

x t — + .. • + fp ( X t - i ) xt- p at , (4.27) 

其中 X t - t = ••- , x t - kY 是由 A 的延迟值所构成的 向量. 如果有必要， X t _x 

可以包含在1时刻已知的其他解释 变量. (4.27) 式中的，(.）往往假定是几乎处 
处连续、甚至是二次可微的 • 前面讨论过的绝大部分非线性模型都是 FAR 模型的 
特殊 情形. 在实际应用中，我们可用非参数方法（如核回归或局部线性回归）来估 
计函数型系数/士).特别 是当不 ^的维数较低的时候可以这样做（尤其是当 
是一维的时候).最近， Cai ， Fan 和 Yao (2000) 用局部线性回归方法去估计 /,(.), 证 
明了用 FAR 模型可以在向前1步预测上获得很大改进. 
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4.1.7 非线性可加 AR 模型 

把非参数力法应用到非线性时间序列分析中的一个主要困难是“维数灾难” 
(curse of dimensionality ). 考虑一个一般的 All ( jp ) 过程 x * = • • - , x t - p ) + at . 

直接用非参数方法来估计 /(•) 将需要 p 维的平滑.当 p 很大时这难以做到，尤其是 
在数据点的个数不是很 多时. 克服这一困难的一个简单 ifQ 有效的方法是考虑口 J 加 
模型，这样的模型只需要低维的平滑.称时间序列 A 服从非线性可加 AR (简记为 
NAAR ) 模型，若 

p 

xt = /o(t) 4- -I- at, (4.28) 

i=l 

其中 _ M .) 是几乎处处连续的函数.因为每个 /<(.) 只有一个自变量.可以用一维平 
滑方法，从而避免维数灾难在应用中，在给定 M .)， j 笋 i 的条件下.估计 /,(.) .这 
种迭代方法可用来估计 NAAR 模型更多细节和 NAAR 模型的例子，可参见 Chen 
和 Tsay (1993 b ). 

可加性的假设限制性相当强，所以在应用中要仔细检验 • Chen , Liu 和 Tsay 
(1995) 考虑了检验可加性的检验统计量. 

4.1.8 非线性状态空间模型 

利用 MCMC 方法的最新进展 （Gelfand 和 Smith (1990))， Carlin , Poison 和 
StofFer (1992) 提出了非线性状态空间建模的蒙特卡罗方法.所考虑的模型为 

St = + x t = gt{S t ) + vt , (4.29) 

其中是状态向量， A ㈠ 和奶 ㈠ 是依赖某些未知参数的已知函数 • {叫}是具有零 
均值、非负定的协方差矩阵的独立同分布的多元随机向量序列，{叫}是均值为 
零、方差为4的独立同分布随机变量序列，且 { t / t } 与 { M 独立.因为对于一个非 
线性系统，需要给定私 q 的条件下况的整个条件分布.所以蒙特卡罗方法可用来 
处理状态转移方程的非线性演变 . Kitagawa (1998) 及其参考文献中考虑了其他的 
对非线性时间序列分析的数值平滑方法. MCMC 方法（或者一些高强度计算的数 
值方法）是非线性时间序列分析的有力工具,但这些方法的潜力还没有充分发掘出 
来.然而， (4.29) 式模型中假定 了 /,(.) 和讲 (.） 的形式已知，这是在实际应用中运用 
卜述 方法的障碍.克服这一局限的方案是，使用诸如对 FAR 和 NAAR 模型分析时 
所用的非参数方法，在用非线性状态空间模型之前对 /*(.) 和讲 (.） 进行具体化. 

4.1.9 神经网络 

现代数据分析的一个常见问题就是神经网络.神经网络方法可归类为半参数 
方法.有关神经网络的文献非常多.它在很多学科中有应用，且应用成功的程度也 
不尽相同，具体可参见 Ripley (1993) 的第2节所列的应用以及第10节中关于其在 
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金融中应用的评汴. Cheng 和 Tittenngton (1994) 提供了从统计学角度看神经网络 
的信息.本节主要关注“前馈 "( feed - forward ) 神经 网络. 它将原始信息输入到由一 
个或几个神经元（或称为结点）构成的输入层，而这些结点向前连接到下一层.直 
到到达输出层.图 4 8 举了一个简单的例子.它是带有一个隐层的、用来 处理元 
时间序列分析的简单的前馈神经 网络. 其输入层有两个结点，隐层有三个结点.输 
入层的每个结点都向前连接到毎个隐层的结点上，而这些隐层的结点都连接到输出 
层的一个单独结点.我们称这个网络为个 2-3-1 的前馈神经网络.更多复杂的神 
经网络包括那些带回馈连接的网络都己经在文献中提出，但与我们学习关系最多的 
还是前馈神经网络. 



图 4-8 —个用于处理一元时间序列分析的带有一个隐层的前馈神经网络 


前馈神经网络 

神经网络由一层向下一层处理加工信息是通过一个“激活 函数” (activation fuc - 
tion ) 来完 成的. 考虑带有一个隐层的前馈神经网络，隐层的第 j 个结点定义为 

h i = fi[aoj (4.30) 


其中 A 是输入层第 i 个结点的值，/ ^(0 是一个激活函数，典型的是取 logistic 函 
数： 


fj ( z ) = 


exp ( z ) 

1 + exp ⑷ 


称为偏差，对 i — 求和是指对输入层中所有指向的结点求和，叫』是权重. 
比如在图4~8中的 2-3-1 前馈神经网络的隐层中的第 j 个结点： 


^ _ exp(a 0j j -f w\jXi -f- W2jx 2 ) . 

1 十 exp(croj 十 + W2j.a ： 2)’ J — ，， • 


(4-31) 


输出层的结点定义为 


O = fo (a。。+ D Wjohj^j , (4.32) 

其中激活函数 / o (0 是线性函数或 Heaviside 函数.如果/。 ㈠ 是线性函数，则 

k 

O = «0o + Wjohj, 
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其中 A: 是隐层中结点数目.一个 Heaviside 函数中有这样的 定义： 如果 2 > 0, 则 
Uz ) = 1,否则 f a ( z ) = 0. 把带有 Heaviside 函数的神经元称为门限神经元，“1” 代 
表神经元发出信息.例如，考虑图 4_8 中的 2-3-1 网络，如果激活函数是线性的，则 
其输出值是 


o — a 0o + ^\ a h\ -H w 2 oh 2 4- W3 0 h 3 .， 

如果 / o (.) 是一个 Heaviside 函数，则输出值是 

{ 1, 如果 a 0o + w io hi + w 2 o h 2 + w 3 oh 3 > 0, 
0，如果 o； 0o + w \ 0 h \ + w 2 o h 2 + w 3 o h 3 ^ 0. 

联合各个层来看，前馈祌经网络的输出值可以写成 

O = /« 卜 。。+ ^ : ^jofji^Oj + 5 : WijXi ). 

L j—*o J 

如果允许输入层直接连接到输出层，则该网络变成 

O = /„ 卜 0O + ^2 (^ioXi- {- ^2 Wjofjiaoj + ^2 WijXi) 


(4.33) 


(4.34) 


其中第一个求和号是对输入结点求和.当输出层的激活函数是线性的，输入层到输 
出层的直接连接意味着输出值是输入值的一个线性函数.从而在这个特殊情形下， 
(4.34) 式是线性模型的一般形式.对于图 4~8 的 2-3-1 网络，如果输出激活函数是 
线性的，则 (4.33) 式变成 

3 

° = 。0 。I 〉~] 

其中~在 (4.31) 式中给出-从而该网络有 13 个参数如果用 （3.34) 式，则网络变 
为 

2 3 

o = aoo + ^2 a io^i-\- ^ vijjij ， 

1=1 j=i 

其中 ~在 (4.31) 式中给出.网络参数的数 0 增加到 15 个. 

我们称等式 （4.33) 或 (4.34) 中的函数是半参数函数，这是因为它的函数形式 
是已知的，而结点个数以及结点的偏差和权重是未知的.等式 （4.34) 中从输入层到 
输出层的直接连接意味着该网络跳过了隐层.我们把这样的网络称为一个跳过隐 
层的前馈网络. 

前馈 M 络在神经 W 络的文献中称为多层感知器 (percetrons). 它们在紧集上可 
以通过增加隐层的结点数目一致逼近任何连续函数，具体可参见 Hornik, Stinch- 
combe 和 White (1989); Hornik (1993); Chen 和 Chen (1995). 神经网络的这个性质 
是多层感知器的一般逼近性质.简言之，带有一个隐蔽层的前馈神经网络可以看成 
是一种对一般的连续非线性函数参数化的方法. 
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训练和预測 

神经网络的应用包括两个 步骤： 第一个步骤是训练网络（例如去建立一个网 
络，包括确定结点数目以及佔计它们的偏差和权 重)； 第一个步骒是推断，特别是预 
测.在训练阶段数据通常被分成两部分不相里叠的子样本.第一组于样本用米估计 
已知的前馈神经网络的参数.第二组于样本用第一步建立的 W 络来进打预测和计 
算它的预测精度.通过比较预测效果，可以选出比其他效果好的“最优”网络来进 
行推断.这正是在统计模型选择中应用非常广泛的交叉验证法的思想.也可以利用 
其他的模型选择方法. 

在一个时间序列的应用中，令为网络训练可利用的数据. 
其中 A 表示输入值的向量，而是所关心的序列（比如一项资产的对数收益率). 
对于一个给定的网络，令 A 为输入值是 a 的网络的输出值，可参见等式 (4.34) .训 
练一个神经网络相当于选择它的偏差和权重来最小化某种合适的标准，比如，最小 
二乘 

S 2 = ^2( r t - o t ) 2 . 
e=i 

这是一个非线性估计问题,它可以用一些迭代方法解决.为了保证所拟合函数的光 
滑性，要对前面的最小化问题加上一些附加的约束.在神经网络文献中，向后传播 
(Back Propagation ( BP )) 学习算法是一种网络训练的普遍方法 . BP 方法由 Bryson 
和 Ho (1969) 提出.它从输出层开始逆向进行，并且反复用梯度规则来修正偏差和 
权重. Ripley (1993) 中的附录 2 A 提供了 Back Propagation 的推导.一日.一个前馈 
神经网络建立，它就能在预测子样本中用来计算预测了. 

例 4. 7 为举例说明金融中神经网络的应用，我们考虑 IBM 股票从1926年1月 
到1即9年 I 2 月的月对数收益率，以百分比形式给出并且包括分红.我们把数据分 
为两组子样本.第一组子样本由从1926年1月到1997年12月的864个数据组 
成.下面用它来建立模型.用 (4.34) 的带有三个输入值和含两个结点的隐层构成的 
模型，我们可以得到一个 3-2-1 的序列 网络. 这三个输入值分别记为和 
r t -3, 偏差和权重由下式给出 

rt = 3.22 - 1.81/i(r t _i) - 2.28/ 2 (r t _x) - 0.09r t _i - 0.05r t _ 2 - 0.12r 卜 3 , (4.35) 

其中 r t -i — (rt_i, r t _ 2 , r t _ 3 ), 两个 Logistic 函数是 

f , v _ exp (—8.34 - 18.97 r t _i + 2.17 r ( _ 2 - 19.17 r t _ 3 ) 

mn - t ) - i + eocp (-8.34 - 18.97 r t _! + 2.17 r t _ 2 - 19.17 r <_ 3 ) ， 

,, 、 = exp(39.25 22.17r t -i 17.34r t _ 2 - 5.98r t _ a ) 

Mr t -i) = j + exp(39.25 - 22.17r t - l - 17.34r t _ 2 - 5.98r t _ 3 )' 
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前面模型的残差标准误差是 6.56. 作为对照.我们也用同一数据建立 AR 模型，得 
到 

r t = 1.101 + 0.077 r t _!-|- a t , < r a = 6.61. (4.36) 

这个模型的残差标准差比式 （4.35) 的前馈祌经网络的稍微大一点. 

预测比较 


1998年和1999年的 IBM 股票的月对数收益率构成了第二组子样本，用其来 
评价神经网络对样本以外的数据的预测效果.作为比较的基准模型，我们用第一组 
子样本的样本均值 rt 对第二组子样本的所有月收益率进行1步向前预测.这相 
当于假定 IBM 股票的月对数价格服从一个带漂移项的随机游动 模铟. 这个基准模 
型均方预测误差 （ MSFE ) 是 91.85. (4.36) 式的 AR (1) 模型.它的1步向前预测的 
MSFF , 是91 70因此， AH (1) 模型比基准模型效果稍好一点.而 (4.35) 式的 3-2-1 
前馈网络的 MSE 是91.74,与 AR (1) 模型效果基本相同. 

注释我们用初始权重设为缺省值的 S - Plua 程序来完成对前馈网络的估计. 
要了解更多信息参见 Venables 和 Ripley (1999). 我们有限的经验表明估计结果是 
变化的.对例 4.7 中用到的 IBM 股票收益率， 3-2-1 网络的样本外数据的 MSFE 最 
低可为 89.46. 最高可到 93.65. 如果我们改变隐层的结点教目，则 MSFE 的变动范 
围可以更宽.附录 B 给出了例 4.7 中用到的 S - Plus 指令. U 

例 4.8 前馈网络的优良特性包括其灵活性和广泛适用性.举个例于.我们用一个 
网络，它的输出层的激活函数是 Heaviside 凼数，来预测例 4.7 中考虑的 IBM 股票 
的价格变动方向.定义一个指不变量 

. = f 1,如果 r t 彡0， 
f ~ 1 0,如果 r t < 0. 


我们用8个输入结点和4个隐层结点建立一个 8-4-1 前馈网络来预测第一组子样 
本的由，其中8个输入结点是由前4个 q 和的延迟值组成的.这个网络用卜 
算在笫二组子样本中的1少向前的向上运动（例如正收益）概率.图 4-9 表示的是 
一个典型的概率预测的输出值和第二组于样本的实际々向，后者在图中以 “ o ” 标 
出. 在图屮添加一条概率为 （).5 的水平线.如果我们采用较为严格的 方法： 当概率 
预测结果大于或等于 0.5 时，令杰=1,否则令忒= 0. 那么神经 W 络的预测成功 
率为 0.58. 当从一个估计变成另一个时，这个网络的成功率会显著改变，这个网络 
有 4 9个 参数. 为了更深入的理解.我们做一个模拟研究，将 8-4-1 网络运行500次， 
计算用以前的方法预测时向上或向下运动的出错数目.在这500次中，平均错误的 
数目和错误的中值分别是 11.28 和 11. 错误最多和最少的数目分别是18和4.作 
为对照.我们再用带漂移项的随机游动模型进行500次模拟预测，即 
： f 1, 如果 = 1.19 + 0 彡 0， 

4 = 1 0,否 则，. 
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其中 1.19 是 IBM 股票从1926年1月到1997年12月的平均月对数收益率， { e t } 是 
服从 N (0, 1) 的独立随机变量序列.预测错误的数目的平均值和中位数变为 10.53 
和11,而错误最多和最少的数目分别是17和5.图4~10是两种模拟方法的预测出 
错数目的柱状图.结果表明对于 IBM 股票的月对数价格, 8-4-1 前馈神经网络不比 
假定为一个带漂移项的随机游动的简单-模型更好. 



图冬9 用 8-4-1 前馈神经网络对 IDM 股票 HI 的月收益进行1步向前概率预测.预测期是从 

1998年1月到1999年12月 




神妗 M 络 带溧移的随机游动 

图 4-10 对 IBM 股票的月对数收益率的变动方向进行 预测时 错误数目的柱 状图. 预测期是从 
1998年1月到1999年12月 

4.2 非线性检验 


本节讨论一些在文献中出现过的非线性检验方法.它们对 4.3 节中考虑的非线 
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性模型有很好的功效.所讨论的检验包括参数和非参数统计量.平方残差的 Ljung - 
Box 统计，双谱检验 （bispectral test ) 和 BDS 检验都是非参数方法. RESET 检验 
( Ramsey , 1969), T Sa y (1986,19 S 9) 的 F 检验，以及其他的拉格朗日乘子法和似然比 
检验法都依赖特定的参数函数.因为非线性的情况有很多，所以检测非线性时没有 
比其他方法都更好的一种单独的检验方法. 

4.2.1 非参数检验 

在线性假设下，一个合适确立的线性模型的残差应该是独立的.任何对残差独 
立性的违背都说明了现有模型包括线性的假设不合适.这就是各种非线性检验背 
后的基本思想.特别地，设计一些非线性检验就是用来检验指定的时间序列的一次 
形式可能出现的违背情况. 

平方残差的 Q - 统计量 

Mcleod 和 Li (1983) 对 ARMA { p , q ) 模型的平方残差应用 Ljung - Box 统计量来 
检査模型的不足.这个检验统计量是 

Q ( m ) = T(T + 2 ) J2 ^ 1 , 

t=l 1 

其中7 1 是样本容量 • m 是一个恰当选取的在检验中自相关的数目，„,是残差序列， 
而 M ) 是 W 的 i 阶自相关函数 ( ACF ). 如果现有的线性模型是合适的， Q ( m ) 应 
该渐近服从自由度为 m - p - 的 V 分布.就像第3章提到的那样，前面的统 
计暈用来检测〜的条件异方差性，渐近等价于 Engle 在1082年提出的对 ARCII 
模型的拉格朗日乘子检验法统计量，貝体可参见 3.4.3 节.这个统计量的原假设是 
= 其中负是下面的线性回归的的 系数： 

= A) + A a t-1 + . .. + + et, 

其中 t = m + 1，…， r . 因为这个统计量由残差计算得到（而不是直接观察到的收 
益率)，所以自由度是 m — p—q. 

双谱检验 (Bispectral Test) 

该检验方法可以用于检验线性和正 态性. 它建立在这样一个结 果上： 线性时间 
序列合适的标准化的双谱对所有频率都是常数,而且在正态时，这个常数值就是零 
一个时间序列的双谱是该序列的三阶矩的 Fourier 变换.对 （4.1) 式的平稳时间序 
列: r t ， 其三阶矩定义为 

OO 

c ( u , v)=g ^ ipkfpk + url > k+v 


(4.37) 
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其中 w 和 t ， 是整数 . p = E ( af ), 咖=1，当 fc < 0时咖= 0.对 (4.37) 式作 Fourier 
变换，我们得到 


b 3 ( wi , w 2 ) = [-(Wi + w 2 )\ r ( wi ) r ( w 2 ), (4.38) 


其中 r ( w ;) = Yj 分 tiexp (- i « m ), 而 i = >/-!> 是频举 • it 的谱密度函数由下式给 

u=0 

出： 

p(w) = 会 ir ⑻卩， 


其中 w 是频率.从而，函数变为 


6^!,14；2)= 


M 忉 1 ，忉 2)| 2 

p{wi)p(w 2 )p(wi 十 《； 2 ) 


常数，对所有 ( W 1 , W 2 ). 


(4.39) 


双谱检验利用了 (4.39) 式的性质.基本上,我们通过选取合适的格子点来估计 (4.39) 
式中的函数 fcK ，«； 2 ) 并且用一种类似 Hotelling 的 P 统计量的检验统计量来检 
验 b ( w 1 , w 2 ) 的常数性.对一个线性高斯序列， E ( a ?) = 所以双谱对所有频率 
( w u w2 ) 都恒为零.对双谱检验的更详细的讨论可参见 Priestley (1988), Subba Rao 
和 Gabr (1984), Hinich (1982). 有限的经验表明当样本容量很大时，这种检验法有 
很好的功效. 

BDS 统计量 

Brock , Dechert 和 Scheinkman (1987) 提出了一个检验统计量.通常称之为 
BDS 检验.它用来检测一个时间序列的独立同分布假设.这个统计量不同于其他 
讨论过的检验统计量，因为后者主要集中在的2阶或3阶性质上. BDS 检验法 
的基木思想是利用混沌时间序列分析中常见的“相关性求和给定一个 A 维时间 
序列和观察值 { X t } Jl v 定义其相关性求和为 

⑽ ) 狀抑 （ 4 . 40 ) 

其中 I 6 ( u , v ) 是一个示性变量.当 || u - v\\<S 时它等于1，否则等丁- 0,其中 11.11 是 
上确界范数 ( Hupuorm ). 相关性求和度量了相距不超过 (5 的一对数据 { X t } 占所有 
数据对的比重.考虑下一个时间序列.设 fc 维向童々= 

称为 fc 历史. BDS 检验的思想如下.把一个 A : 历史看成 fc 维空间屮的一个点.如采 
确实是独立同分而随机变量序列的话，那么 fc 历史 { X t }^ x 应该在 it 维空 
间中看不出样式来.从而，相关性求和应该满足关系 C k {6) = [ Ci (6) j fc . 如果违背了 
此式就表明 A 小是独立同分布的.举一个简单而又能说明问题的例子.考虑一列 
独立同分布的随机变量，服从[0，1】上的均匀分布.令 卜， b ] 是丨 0， lj 的子区间，考虑2 
历史 （ ar t ， x t + i ), 它表示2维空间中的一个点.在独立同分布假设下，在 [ a , b ] x ( a , b ] 
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中 2 历史数目的期望应该等于 [ a , b ] 中❿数目期望的平方.这个想法可以用相关 
性求和对应的样本进行正式的检验.定义 

Ci(6,T) = - _ T) 石 I s (X t 'X ;)，Z = l,fc, 

其中 = T - i + 1. 当 Z = 1时 当 i = A •时叉 ，= Xf . 在 { Xt } 是独 

立同分布的并有非退化的分布函数 F (.) 的原假设下， Brock , Dechert , Scheinkman 
(1987) 指出，对任意固定的 it 和5都有 

C k ( fi , T ) -> [ OiW] fc :(以概率 1，当 T — oo ). 

更进一步，统计量 Vf { c k ( S , T )- [ C ,(.5, T ) l fc } 渐近于正态分布，其均侑为零，方差 
是 

a ^(«5) = 4 ( AT fc + 2 j 2 Nk ~ j C 2j + ( A : - l ) 2 C 2fc - k 2 NC 2k ~ 2 ^j , 

其屮 （7 = [ F(z + (5) — K(z - d )】 dF ( z ), AT = J [ F{z + 6)- F { z - < y ) j 2 dF ⑷.注意到 
CMAr ) 是 C 的相合估计，而 AT 的相合估计可以为 

N (6， T ) = Tk ^ rp k _ _ 2 ) £ 5 Z ^ s { x t , x a ) Is ( x a , x u ). 

于是 BDS 检验统计量定义为 

DMT ) = Vf { c k ( S , T )- [ CU ^ T )]*} / a k ( S , T) t (4.41) 

其中 cr k ( S , T ) 是在 a k ( S ) 中用 CMAr ) 和 N ( S , T ) 分别代替 C 和 iV 时得到的.这 
个检验 统计簠 的极限分布是标准正态的.应用 BDS 检验的更多的讨论和例子请见 
Hsich (1989); Brock , Hsieh , LeBaron (1991). 实际应用中，在用 BDS 检验前如果数 
据有线性相依性，则我们要 i 掉其相依性.这种检验对 fc 和5的选择可能很敏感. 
尤其当&比较大的时候. 

4.2.2 参数检验 

本节将 H 光转向参数检验.考虑 Ramsey 的 RESET 检验 (1969) 以及它的推 
广.我们仍然讨论一些检验统计量米检测门限非线性.为简化记号，我们在讨论中 
使用向童和 矩阵. 如果需要的话读者可以浏览第8章的附录 A 简单复习一下向量 
和矩阵的相关内容. 




RESET 检验 
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Ramsey (1969) 提出一神对线性最小二乘回归分析的规范检验.称这个检验为 
RESET 检验.它可以很容易地应用子线性 AR 模型.考虑一个线性 AR(p) 模型： 


xt = -f « tl (4.42) 

其中 -^t-i = • - - <t> = (00，必1， …， <l>pY- RESET 检验的第一步是获 

得 (4.42) 式中的最小二乘估计衣然后计算拟合值 A = X\_ x ^ 残差 a t =x t -x t , 

以及残差平方和 SS/?o= £ al 其中 r 是样本容量.第二步考虑线性 回归： 

t=p-f 1 

at = 4- 4-v t , (4.43) 

其中 M t _ 1 = (z t 2 ,-.. ,x a t +i y. 对某个 s > l, 再计算最小二乘残差 


vt=a t -X , t _ 1 a l -M , i _ 1 6i2 1 

以及回归的残差平方和 SSIh = E t)?. RESET 检验的基本思想是如果 (4.42) 

式的 AR(p) 模型合适的话，那么 (4.43) 式中的和《 2 应该为零.这可以通过一 
般的 F 统计量进行检验. (4.43) 式的 F 统计暈 如下： 


{ SSRq - SSR^/g 
~ SSR^/iT-p-gY 


其中 g = s-¥p-\-l. 


(4.44) 


在线性和正态性假定下，它服从自由度是 s 和: T-p-g 的 F 分布. 

注释：因为封（对 fc = 2，...，s + l) 与 X t -A 以及它们自身之间趋向于有高 
度相关性，所以用 M t _, 的与没有线性关系的主成分对 (4.43) 式进行拟合. 
主成分分析是一种降維的统计工具，参见第8幸的更多内容 □ 

Keenan (1985) 提出了一种对时间序列的非线性检验 方法. 此方法只用到赶 
并且修正了 RESET 检验法的第二步来回避封和 X t ^ 之间的多重共线性 ( m ul- 
ticollinearity). 特别地， (4.43) 式的线性回归分成两步.在 2(a) 步，通过拟合回归移 
除苟对 X f _x 的线性依赖关系 


金？ = 又：1月+ Wt， 

得到残差 u t = x? - 夂在 2( b) 步， 考虑线性回归 


a t = u t a -h vt, 

得到平方残差和 £ (ot-u t d) 2 = f： 诗来检验原假设 o = 0. 

t==p*f 1 t=p4-l 




164 第 4 章非线性模型及其应用 


尸检验 

为了改进 Keenan 的 RESET 检验的功效， Tsay (1986) 选择了不同的回归量 
特别地，他建议使用 M t _x = vcdi ( X t ^ X [^ 其中 vech ⑷表示矩阵4 
的半拉直向量，即 A 对角线及其下面的元素组成的向量，具体可参见第8章的附 
录 B. 例如，当 p = 2时， AR(p ) 模型，的 
维数是 p(p+l)/2. 在实际中，这个检验法就是对如下线性最小二乘回归用普通偏 
F 统句量来检验 a=0: 

Xt = X \^ x < t > -I- M' t _ x OL -f e t , 

其中 e t 是误差项.在 a 是线性 AR(p) 过程的假定下，偏 F 统计量服从一个自由 
度为 g 和 r-p-p-1 的 F 分布，其中 y = p(p 十 1)/2. 我们把这种 F 检验称为 
On-F 检验. Luukkonen, Saikkonen 和 Terasvirta (1988) 进一步发展了 这个检验法， 
将增加到了有三次项(对 i = l,...,p). 

门限检验 

在研究中，当备择模型是 SETAR 模型时，人们总可以选具体的检验统计量来 
增加检验的功效这些具体的检验统计量之一就是似然比统计量.不过，这个检验 
遇到了在线性的原假设下没有定义参数的困难.这是因为对线性 AR 过程门限是没 
有定义的.另一种具体的检验试图将检验门限非线性转化成探测模型的变化.对门 
限非线性讨论这两种方法的区别很有趣. 

为简化讨论，让我们考虑一个简单的例子.备择模型是门限变量为 or t _ d 的2 
体制 SETAR 模型.原假设是 /fo: 〜服从线性 AR { p ) 模型 

P 

xt — + + a t , (4.45) 

i=l 

而备抒假设是 H u: : r, 服从 SETAR 模型 

P 

</>0 1) + ^2 ^ Xt-i + ait, 若： E t _d < n， 

(4-46) 

4 2) + Z 4 2) + a 2t ，若 x t -d > n, 

t=l 

其中 n 是门限.对给定的实现值 {x t }T =1 , 假定它是正态的并令为对 
数似然 函数. 它是以冷-(如，•..，知/和4的最大似然估计计算得到的•这 
很容易计算.如果给定门限 n , 那么在备择条件下似然函数也是易于计算的•令 
“(n 碲心.与）为对数似然函数，它是在知道门限 n 的条件下，由也 =(C ， 
0^/和4的最大似然估计计算得到的.对数似然比定义为 

z(n) = 4(rr,0,,af;0 2； <5-|) -Zo(0^o)- 
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它是未知门限 n 的函数.然而在原假设下,并没有门限而且 n 没有定义.在原假设 
下参数 n 称为讨厌参数 （nuisance parameter ). 因此似然比的渐近分布与通常的似 
然比统计量有很大不同.可以参见 Chen (1991) 以获得更多的细节和这个检验的临 
界值 (critical value ). —个通常的做法是取= sup w < ri < t ,/( n ) 作为检验统计量， 
其中 t ， 和 u 是事先指定为门限的下界和上界 . Davis (1987), Andrews 和 Ploberger 
(1994) 更进一步地讨论了原假设下含讨厌参数的假设检验.模拟法经常用于获取 
柃验统计量的经验临界值，而依赖干 W 和 M 的选择. Z ( r ,) 在 n e [v,u] 
上的平均值也被 Andrews 和 Ploberger 考虑作为检验统计量. 

Tsay (1989) 利用排序自回归 （arranged autoregression ) 和递归估计得到另外一 
个门限非线性的检验.在备择假设礼下，排序自回归试图将 SETAR 模型问题转 
变成一个模型改变问题，其改变点就是门限 n . 为说明这点， (4.46) 式的 SETAR 模 
型是说 A 实质上服从两个线性模型，分别依赖丁 x t - d < ri 或对实现 
值{:*}:1， » t-d 取值 .， x T _ d } ■令 W a ; (2) < …< a : ( r - d ) 为抹 
列好的数据（比如将这些观测值按递增的顺序排好).这样 SETAR 模型可写成 

P 

x U)+d = ⑴ +d_< + Q(j) +d , j = 1, • • • ,T - d, (4.47) 

其中当 a : ⑴ < n 时 A = 0 P ， 当 : r ⑸彡 n 时戊 =0 j 2) . 从而，门限 ri 是 （4.47) 式 
线性回归的改变点，我们称 (4.47) 式为排序自回归（门限是递增顺序的).注 
意到 （4.47) 式的排序自回归并没改变对: c t _ ，(对 I ，... ， P ) 的动态依赖性，这 
是因为 x ij )+ d 仍然依赖于“(对 Z = 1,… ， P ). 上面完成了将 SETAR 模型放 
到门限空间中以代替时间空间.这就是说，带有较小的: c t _ d 的式子会出现在带有 
较大 x t _ d 的式子之前 . Tsay (1989) 的门限检验如下. 

第1步用 j = 1,... , m 拟合 （4.47) 式，其中 m 是事先指定的正整数（比如 
3 0)•记啟的最小二乘估计是戌,，其中 m 表示用于估计的数据点个数. 

第2步计算预测残差 

P 

占=工 (m | 1) (d — fto,m — 芝〕 

t=l 

和它的标准误差•令 e ( m +1)+ d 为标准化的预测残差. 

第 3 步用递归最小二乘法去修正最小二乘估计 A . m +1, 它是通过合并新数 
据点 ®( m + l )+ d 实现. 

笫 4步重复第2, 3步，直至所有数据点都处理过. 

第5步考虑标准化的预测残差的线性回归 

P 

十 J) 十 d = °=0 + a<a; (m+j)+d-* I t/ t , J = 1, • ,T - d — m, (4.48) 
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并计算通常的 F 统计量以检验 (4.48) 式中的 « i =0 (i = 0,--, p ). 在❹ 服从线性 
AR ( p ) 模型的原假设下， F 比率的极限分布是一个自由度为 p + l 和 r - d-m — P 
的 P 分布. 

我们称上面的 F 检验为 TAR - F 检验. 这个检验背后的思想是，在原假设下 
(4.47) 式的排序自回归中没有模型改变.所以标准化的预测残差应该接近均值为0、 
方差为1的独立同分布的随机变量.在这种情况下，那些标准化的预测残差应该与 
冋归值不相关.要了解更多关于递归最小二乘法和 TAR - F 检验表现的 
模拟研究的细节，请参见 Tsay (1989). TAR - F 检验回避了似然比检验中遇到的讨 
厌参数问题.它不要求知道门限 n 并且只是简单地柃验了在原假设下预测残差与 
回归值的不相关性.因此，这个检验不依赖子一定要知道备择模型中体制的数目 • 
但 是如果真实模型确实是有已知更新分布的 2 休制 SETAR 模型，那么 TAR - F 检 
验的功效不如似然比检验. 

4.2.3 应用 

本节把先前讨论的一些非线性检验应用到5个时间序列中.对一个真实的金 
融时间序列.一般用 AR 模型移除数据中的相关成分，然后将检验用到模型的残差 
序列中.这5 .个序列如下. 

(1) r lt , 500个观测值组成的独立同分布的.服从 N (0,1) 的模拟序列. 

(2) r 2 t ： 独立同分布的，服从自由度为6的 f 分布的模拟序列，样本容量是 MO . 

(3) a 3t ： 1926 年到 1997 年的 CRSP 等权重指数月对数收益率的郎 4 个观测值 
的残差序列.用到的线性 AR 模型是 

(1- 0.1805 + 0.099 B 3 - 0.105 J 3 9 ) r 3< = 0.008 6 + a 3t . 

(4) a ^： 1926年到1997年的 CRSP 的价值加权指数月对数收益率的864个观 
测值的残差序列.用到的线性 AR 模型是 

(1 - 0.0985 + 0.111B 3 - 0.0885 5 )r4t = 0.007 8 十 a 4t . 

(5) a 5t ： 1926年到1997年的 IBM 股票月对数收益率的864个观测值的残差 
序列-用到的线性 ATI 模型是 

(1- 0.077fl)r 8t = 0.011 + a 5t . 

表4^2是非线性检验的结果.对模拟序列和 IBM 收益率， F 检验是建立在 AR (6) 
模型的基础上的.对指数收益率， AR 的阶与前面的模型样.对 BDS 检验，我们 
选择 rt == 和 = 1.5 d a , k 取2,… ，5. 表中还给出了 Ljung - Box 统 i | 量以确定在 
应用非线性检验前残差序列没有序列相 关性. 与它们的渐近临界值比较. BDS 检验 
和/^检验对模拟序列在5%的水平下是不显 著的. 不过对真实的金融时间序列而 
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言， BDS 检验却是高度显著的 . F 检验对指数收益率也显示出了显著的结果.但它 
们没有检验出 IBM 对数收益率的非线件.总之，这®柃验证明了模拟序列是线件 
的并认为股票收益率是非线性的. 


表4~2 对模拟序列和一些股票对数收益丰的非线性检验 1 



a 换拟序列的样本存量是500,股栗收益率的样本容 S 是 864. BDS 检验用 fc =2, -- ,5. 


4.3 建 模 


非线性时间序列的建模必须包含一些主观判断.不过，仍然要遵守一些总休上 
的准则.非线性检验开始时要建立在一个合适的线性模型的基础上.对金融时间 
序列， Ljmig-Box 统计量和 Engle 检验通常用于检测条件异方差性.对一般序列， 
可以用 4.2 节的其他检验法.如果非线性在统计上是显著的，那么可选择接受一 
类非线性模型.这种选择可能依赖分析者的经验和研究问题的实质.对于波动率 
模型， ARCH 过程的阶是通过检査平方序列的偏自相关函数确定的.对 GARCH 
和 EGARCH 模型，在绝大多数应用屮，只考虑如冋（1，1)， （1,2) 和 （2,1) 低阶的情 
况.更高阶的模型很难估计和 理解对 TAR 模型， oj 以用 Tong (1990) 和 Tsay 
(1989,1998) 给出的步骤程序建立合适的模型.当样本容量充分大时,可以用非线性 
技术去探测数据的非线性因素，然后据此选择合适的非线性模型.具体可见 Chen 
和 Tsay (1993 a ) 以及 Cai，Fan 和 Yao (2000). Lewis 和 Stevens (1991) 的 MARS 程 
序也可以用来探测数据的动态 结构. 最后，像 Akaike 信息准则 ( Akaike ,1974) 这样 
的信息标准以及广义机会比 ( Chen , McCulloch 和 Tsay (1997)) 可以用来区分候选 
的非线性模型.选定的模型在被用来预测前应该仔细检査核对. 


4.4 预 测 


与线性模型小同，当 m 测长度大于1时，对绝大多数非线性模型，计算其预测 
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值并没有显示表达公式.我们用参数自助 （parameric bootstraps) 法计算非线性预 
测值.我们很容易理解，模型在用于预测前需要严格的检査以判断对所研究的序列 
是否合适.通过一个模型.我们可以了解动态结构和新息分布.在某些情况下.我们 
可以把估计的参数看作已知的. 

4.4.1 参数自助法 

令 T 为预测原点，/为预测步长 （Z > 0). 这就是说，我们处在时间指标: T 处 
并对预测 x Tl i 感兴趣参数自助法计算实现值 rr T , i , ••- , t . t “依次通过下面步 
骤 ： （ a) 从模型指定的新息分布中重新抽取一个新的 新息； 00 用模型、数据以及以 
前的预测 x T+1) - 计算 r r + t . 这样得到的一个实现值.重复这个过 

程 M 次来得到的 M 个实现值，并用表示. x T + i 的预测点就取 
x^ +l 的样本均值.令预测为 x T {l). 在一些应用中我们取 Af = 3 000,并且结果证明 
效果不错.实现值也可用于获得 XT+1 的经验分布.我们稍后利用经验 
分布去评估预测功效. 

4.4.2 预测的评估 

评佔模型的预测功效有很多方法，从方向度量到大小度童再到分布度量. 力问 
度量考虑由模型可推知的将来的变动方向（上升或下降).预测明大的 S&P 500指 
数将要上升或卜降是一个有实际意义的方向顸测的例顸测年终日 S & P 500 指 
数的价值属于大小度置的例子.最后，评估从现在到年终的日 S & P 500 指数将上升 
10%或更多的可能性要求知道将来该指数的条件概率分布.而评估这样一个估价的 
精度则需要分布度量. 

在实际中，可利用的数据集被分成两部分子样本.第一部分子样本的数据用来 
建立一个非线性 模型; 第二部分子样本用来评估模型的预测功效.我们称这两部分 
子样本分别为估计子样本和预测子样本.在一些研究中，常使用滚动预测程序.当 
预测原点前进时,一个新的数据点从预测子样本转移到估计子样本中.下面我们将 
简要地讨论文献中一#通常用到的预测功效的度量方法.不过要记住的是在比较 
模型优劣时不存在单独地被广泛接受的度量方法.为了更好地了解这种比较，可能 
需要一个基于预测目的的效用函数. 

方向度量 

一个典型的度量法是用一个2 x 2的列联表来总结在预测子样本中预测 . r T+< 
上升和下降的相对应的模铟的“击中” （ hit ) 和“丢失” ( misse ) 数目.具体说来，列 
联表如下给出 




4.4 预 测 169 


实际 

预测 


上 下 


上 

mu m \2 

叫 0 

下 

TH 21 7 T 122 

m 2 o 


moi mo 2 

m 


其中 m 是预测子样本中 f 少向前预测的总数目 . m u 是预测向上运动且击中（预测 
正确）的数日， m 21 是预测市场向下运动且丢失（预测错误）的数目，依次类推 . m n 
和 m 22 有较人值意味着较好的预测.其检验统计量 

2 2 /„ mioTnoi \2 

v 2 = ^ ~ m ) 

^ / j / 』 mionioi 


可以用米评估这个模型的功效.大的 x 2 值表示该模型优于随机选择的机会.在一 
些适度的条件卜, X 2 渐近服从自由度为1的 X 2 分布.有关这祌度量的更进一步讨 
论见 Dahl 和 HyUeberg (1999). 

作为方向度量的例子，考虑图4~9中的 8-4-1 前馈神经网络的1步向前概率预 
测.这个网络的击中和丢失的2 x 2表格是 


实际 

预测 


上 下 


上 

12 2 

14 

h 

8 2 

10 


20 4 

24 


这个表显示了该网络对向上运动的预测不错，但对股票向下运动的预测不理想.这 
个表格的 X 2 统计量是 0.137, p 值是 0.71. 从而，网络并没有显著地优于一个对向 
上向下等概率的随机游动模型. 


大小度量 

有3个统计量经常用: T 度量点预测的功效.它们是均方误差 （ MSE )、 平均绝 
对偏差 （ MAD ) 和平均绝对百分比误差 （ MAPE ). 对 f 步向前预测，这些度量定义 
如下 

1 m —1 

MSE (；) =—二 [® T + i+i — XT + j ( l )] 2 -, (4.49) 

m i=o 

1 Tft — 1 

MAD ⑴ = ~ S l ^+ i+j - x T + j ( l )\, (4.50) 


MAPE ( Z ) 


i=o 


工 r + j (/) 

x T-^j+l 


(4.51) 


其中 m 是预测子样本中可用于 f 步向前预测的数目.在应用中，人们通常选择上 
面3种度量之一.这种度量取值最小的模型被认为是最好的/步向前预测模型 .Z 
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的不同可能会导致选用不同的模型.这些度量在模型对比中仍然有其他的局限性. 
具体可参见诸如 Clements 和 Hendry (1993) 的文献. 

分布度童 

从业人员最近幵始用预测分布来对一个模型的预测功效进行评佔.严格来讲， 
预测分布融合了预测时参数的不确定性.如果参数可看作固定的话，我们就称它为 
条件蚀测分布.通过参数自助法得到的 x T + l 的经验分布是一个条件预测分布.这 
个经验分布通常用于计算分布度量.令 U T ( l ) 为观测值 XT + 1 在前面所述经验分布 
中的分位数.我们有一个 m 个分位数的集合，其中爪是预测子样 
本中/步向前预测的数目.如果接受的模型合适品话， {u T+> (/)} 应该是服从 [O.lj 
上均匀分布的一个随机样本.对一个充分大的 m ， 可以计算服从 [0，lj 上均勻分布 
的 { wr + j 的 Kolmogorov-Smirnov 统计量.这个统计量可用于模型的检验和预 
测的比较. 


4.5 应 用 

本节通过分析 1948 年到 1993 年经季节调整后的每季度美国平民失业率来说 
明非线性时间序列模型. Montgomery, Zarnowitz, Tsay 和 Tiao (1998) 详细地分析 
过这个序列.这里我们用非线性模型重复他们的一些分析内容.图 4*11 是数据的 
时间阁.这个序列明显的特征包括：⑷倾向于与美国商业周期相反周 期性； （b) 失 
业率上升时很快，下降时却很慢 . （h) 特征说明该序列的动态结构是非线性的 



图 4~ U 从1948年致1993年每季度美国失业率（经季度调整后）的时间图 

记该序列为; Tt 并且令 Axt = Xt - X t - 1 为失业率的变动值. Montgomery 等人 
(1998) 建立了线性模型 

(1-0.31B 4 )(1-0.65B)Aa; t = (1-0.78 丑^叫， g = 0.090， (4.52) 
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其中三个系数的标准差分别为 0.11,0.06 和 0.07. 里然数据经过了季节调整，但模型 
还是呈现了季节性.这说明季节调整并没有成功地移除季节性.我们把这个模型当 
作预测比较的基准模型. 

为 检验廿 线性，我们对由差分序列建立的 AR (5) 模型进行 4.2 节中介绍 
过的一些非线性检验.结果在表 4-3 中给出.所有的检验法都拒绝了线性假设.实 
际上，已经拒绝了所有使用 AH(p) (其中 p - 2,… ， 10) 模型的线性假设. 


表4~3 1948年第二季度到1993年第四季度的美国季度失业率变化的非线性检验 


类型 

Ori-F 

LST 

TAR ( l ) 

TAR (2) 

TAR (3) 

TAR (4) 

检验 

2.80 

2.83 

2.41 

2.16 

2.84 

2.98 

P 值 

0.000 7 

0.000 2 

0.029 8 

0.050 0 

0.012 1 

0.008 8 


a 使用 AR (5) 模嘴， LST 表示 Luukkonen 等人 (1988) 提出的检验， TAR ( rf ) 指的是延迟为 rf 的门 
限检验 . 


用类似于 Tsay (1989) 的建模程序， Montgomery 等人 （ 1998) 对序列建立 
了下面的 TAR 模型： 


Axt = 


0.01 -\- 0.73Aa"i_i -J- 0.10i^X(_2 ait ， 
0.18 + 0.80 △: 0.56AiCc— 2 丨 a 2ty 


如果 Ax t _2 < 0.1， 
否则. 


(4.53) 


和吻的样本方差分别是 0.76 和0.165,体制1的三个系数的标准差分别是 
0.03, 0.10 和 0.12; 体制2的三个系数的标准差则分别是0.09, 0.1 和 0.16. 这个模 
型说明了美国季度失业率的变化值△: r , 在: c t _ 2 _: r ,_ 3 的门限为 0.1 的基准苧间中 
很像一个分段线性模铟.官观上.该模型暗示了随着最近失#率的改变失业人数的 
表现是不同的在第一个体制下，失业率下降或有轻微的上升.这样经济应该是稳 
定的.实质上变动率服从一个简单的 AR (1) 模型，因为2阶延迟系数是不显著的. 
在第二个体制下，失业率 （0.1 或更大）有一个大幅跳跃.这典型地与经济周期的紧 
缩期相 对应. 而且这个时期可能发生政府千预经济以及产业结构调整.这里服 
从一个带正常数项的 AR (2； 模型.显示了 x t 向上的趋势.这个 AR (2) 多项式有两 
个复特征根，显示了 可能的周期 行为. 从而， x t 出现转折点的可能性增人，意 

味着 A 大幅增长的时期会 很短. 这意味着美国经济的紧缩期比扩张期要短些. 

Montgomery 等人 (1998) 用马尔可夫链蒙特卡罗 (Markov Chain Monte Carlo ) 
力法得到下面关于 △而 的马尔可夫转换 模型： 

A / -0.074- 0.38 Aar t _i - 0.05 Aa : t _ 2 -f e lt , 如果 s t - 1, 

Ax t = < m (4.54) 

[ 0.16 + 0.86 Ax t _ x - 0.38 Ax t _2 4 - e 2 t , 如果 = 2, 


△ A 的条件均值当〜 =1 时是-0.10,当= 2时是 0.31. 从而，第一个状态表示 
经济的扩张期，第二个状态表示经济的紧缩期 . e lt 和 e 2< 的样本方差分别是 0.031 
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和 0.192. 在状态 s t = 1时，三个参数的标准差分别是0.03, 0.14 和0.11，而在状态 
A = 2时,它们则分别是0.04, 0.13 和 0.14. 状态转移概率是尸 ( s t = 2 \ s t -i = 1) = 
0.084(0.060) 和 P ( s t = l | a f _, = 2) = 0.126(0.053), 其中括号里的数字是对应的标 
准误差.这个模型说明在第二个状态下，当 AR (2) 多项式有复特征根时，失业率^ 
有向 h 的趋势.模型的这个特征很像 (4.53) 式的第2个体制的 TAR 模型.在第一 
个状态下，失业率^有带弱得多的自冋归结构的轻微的下降趋势. 

预測功效 

Montgomery 等人 (1998) 用一个滚动程序预测失业率: rt . 该程序如下. 

(1) 以 r = 83为预测原点，该点对应于 1968. II . 它在文献中用于监视各种预 
测失业率的模型的功效.用从 1948. I 到预测原点（包括预测原点）的数据估计线 
性、 TAR 和 MSA 模型. 

(2) 进行1季度和5季度的向前预测并计算每个模型的预测误差.对非线性模 
型的预测使用 4.4 节中的参数自助法. 

(3) 预测原点向前移1步，然后重复估计和预测过稈，直到每个数据都使用过. 

(4) 用 MSE 和平均预测误差来比较模型的功效. 

从表 4~4 可以看到 （ 4.52) 式的线性模型， (4.54) 式的 TAR 模型和 (4.54) 式的 
MSA 模型预测的相对 MSE 和平均预测 误差 . 此处用线性模型作为基准.比较是基 
于总体表现和在预测原点美国的经济状况.从这张表格中，我们观察到下面的结论. 

(1) 总体上比较， TAR 模型和线性模型的 MSE 非常接近，但 TAR 模型的偏差 
更小.而 MSA 模型有最大的 MSE 和最小的偏差. 

(2) 当预测原点在经济紧缩期时， TAR 模型无论是 MSE 还是偏差都比线性模 
型表现得要好. MSA 模型也比线性模型好，但没有 TAR 模型好得那么多. 

(3) 当顸测原点在经济扩张期时，线性模型比两个非线性模型要好. 

结果表明了当美国经济处于紧缩期时，在预测美国季度失业率上非线性模型的 
表现超过线性模型.这并不奇怪，因为就像前面提到的，在经济紧缩时政府会干预 
经济并且会进行产业结构调整.这些外部事件引起了美国失业率的非线性.直观 
上，这样的改进很重要.因为在经济紧缩期，人们会更关注经济预测. 


彔4~4 对美国季度失业丰用线性. TAR 和 MSA 模型的祥本外预测的比较 a 

7 Z 预测的相对 MSE 



1步 

2步 

3步 

4步 

5步 

总体比较 

线性 

1.00 

1.00 

1.00 

1.00 

1.00 

TAR 

1.00 

1.04 

0.99 

0.98 

1.03 

MSA 1.19 1.39 1.40 1.45 1.61 


MSE 
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(续) 


预测的相对 MSE 



1 步 

2 步 

3 步 

4 步 

5 步 

经济紧缩时的预测原点 


线性 

1.00 

1.00 

1.00 

1.00 

1.00 

TAR 

0.B5 

0.91 

0.83 

0.72 

0.72 

MSA 

0.97 

1.03 


0.86 

1 02 

MSE 

0.22 

0.97 

2.14 

3.38 

3.46 

经济扩张时的预测原点 

线性 

1.00 

1.00 

1.00 

1.00 

1.00 

TAR 

1.16 

1.13 

1.10 

1.15 

1.17 

MSA 

1.31 

1.64 

1.73 

1.84 

1.87 

MSE 

0.06 

0.21 

0.45 

0.78 

1.24 

预测误差的均值 

总体比较 

线性 

0.03 




0.33 

TAR 





-0.01 

MSA 

0.00 





经济 k 缩时的预测原点 

线性 

0.31 

0.68 

1.08 

1.41 

1.38 

TAR 

0.24 

0.56 

0.87 

1.01 

0.86 

MSA 

0.20 

0.41 

0-57 

U.52 

0.14 

纾济扩张时的预测原点 

线性 

-0.01 

0.00 

0.03 

0.08 

0.17 

TAR 

-0.05 

-0.U 

-0,17 

-0.19 

-0.14 

MSA 

-0.03 

-0.08 

-0.13 

-0.17 

-0.16 


a 预测原点是 1968 年第 2 爷度用 “MSE” 标记的行表示基准线性模型的 MSE ( 均方误差 ). 


附录 A —些关于非线性波动率模型的 RATS 程序 

用于给 IBM 股票日对数收益率建立 AR (2)- TAR - GARCH (1,1) 模型 
数据文件是 d - ibmln 03. txt . 

all 0 10446:1 
open data d-ibmln03.txt 
data(org=obs) / rt 
set h <s 0.0 

nonlin mu p2 aO al bl a2 b2 

frml at - rt(t)-mu-p2*rt(t-2) 

frml gvar = aO + al*at(t-1)**2+bl*h(t-l) $ 

+ %if(at(t-l) < 0,a2*at(t-l)**2+b2*h(t-l), 0 ) 

Crml garchln = -0.5*log(h(t)»gvar(t))-0.5*at(t)**2/h(t) 
smpl 4 10446 

compute mu = 0.03, p2 = -0•03 

compute aO = 0.07 r al = 0.05, a2 = 0.05, bl = 0.85, b2 » 0.05 
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sse—suro( (y-predict (ibm.nn # ibm-x)) A 2) 
print(sse) 

林 eigen(nnet.Hess(ibm.nn,ibm.x,y) # T)$values 

# setup the input variables in the forecasting subsample 
ibm.p_cbind(x[864 ： 887],x[863:886] # x[862:885]) 

# compute the forecasts 

yhjpredict. (ibm.nn # ibtn.p) 

韓 The ohsftrvGd rctumfl in t:he forecaetiing subRamplR 
yo 一 x[865:888 】 

# compute \& print the sum of squares of forecast errors 
ssfe 一 sum (( yo - yh ) A 2) 

print(ssfe) 

# quit S-Plus 

q() 

练习题 

4.1 考虑约翰兄弟公司股票从 1990 年 1 月到2003年12月的日简单收益率.数据放在文件 
d - jnj 9003. txt 中，也可以从 CRSP 得到.把收益率转化为对数收益率,并以百分比形式 
给出. 

( a ) 给对数收益率序列建立一个 GJR 模型，并写下所拟合的模型.在1%的水平下存在 
杠杆效应吗？ 

( b ) 给对数收益率序列建立一个一般的门限波动率模型- 

( c ) 比较两个 TGAHCH 模型. 

4.2 考虑通用电气 ( GE ) 股泉的从1926年1月到2003年12月股泉的月简单收益率.你可 
以从 CRSP T 载数据或使用网上的文件 m - ge 2603. txt . 把收益率转化为对数收益率，并 
以百分比形式给出.设 o t _ j 是 t - 1时刻的扰动，给上述数据建立一个以 a t _, 为门限变 
量 . 0为门限的带 GED 新息的门限 TGARCH 模型.并写下所拟合的模型.在5%的水 
T 下存在杠杆效应吗？ 

4.3 假设 GE 股票的月对数收益率（以百分比形式）服从一个平滑的门限 GARCH (1, 1) 模型. 
对样木时间区间为1926年1月至1999年12月的数据，拟合的模型为 

rt = 1.06 + at , at = at £ t , 

= 0.103a?-! + 0.952^?_! 4- 1+exp ^ 10a — (4 490 - 0.193ff t 2 _,), 

其中所有的估计值都是高度显 著的； 指数中的系数10是事先给定的，以便简化估计 过程; 

是独立同分布、服从 AT (0,1) 的序列.假设 a888 = 16.0 和 ais 8 = 50.2. 1步向前波 
动率预测值的 M ⑴是什么？如果换成<1刪= -16.0, 那么1步向前波动率预测值 4 m ⑴ 
又是什么？ 

4.4 假设一支股泉的月对数收益率（以百分比形式）服从如下的马尔可夫体制转换 模型： 

n = 1.25 + a “ a t = ene *、 

0.10 a ?. t +0-93。?-,， 

4.24 + 0.10 a ? i - h 0.78^ 2 lt 


af = 


如果 A = 1， 
如果 A = 2, 
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其中转移概率为 

P{st = 2|si_i = 1) = 0.15, P{st — = 2) = 0.05« 

假设 a , 00 - 6.0, tr?oo - 50.0 并且以概率1有 a 100 -2. 以 f = 100为预测原点的1步 
向前波动皁预测值是什么？如果《 100 = 2的概率减小到0.8,那么以< =100为预测原点 
的1步向前波动串预测值又是什么？ 

4.5 再考虎通用电气 （ GE ) 股票的从1926年1月到2003年12月股票的月简单收益率用 
后三年的数据来进行预测评价. 

( a ) 用延迟收益率 rt -,， 和 n - 3 作为输入值，给此收益率序列拟合一个 3-2-1 的前 
馈神经网络，并计算其1步向前预测及预测的均方误差. 

( b ) 用延迟收益率 r t _,, r ,- 2 , ^- 3 及其符号（方向）作为输入值,给此收益率序列拟合一 
个 6-5-1 的前馈神经网络，并预测1步向前 GE 股票价格运动的方向,其中1表示向 
上运动.计算预测的均方误差. 

提示：设 rtn 是 S - Plus 中的一个时间序列.为了得到该序列的方向 变量， 使用命令 drtn = 
ifelse ( rtn >0,1,0〉. 

4.6 因为在利串期限结构 中存在 逆收益曲线，所以利丰差是非线性的.为/验证这个事实，我 
们考虑美国的两种周利率 ： （ a ) 1年期固定期限国 库券； （ b ) 3 '牛期固定期限国阵券.如 
第2章中一样，记这两种利串分别力 ru 和 r 3 t . 数据的时间 E 间为196‘2年 L 月5日到 
1999年9月10 口. 数据可从网上文件 w - gs 3 yr . txt 和 w - gslyr . txt 中得到，也可以从 
圣路易斯联邦储备银行得到. 

( a ) 用= r 3l -m 表示对数利率之差. {s t } 是线性 的吗？ 进行非线性检验，并在 5% 
的显著水平下得出结论 

( b ) 用 w = ( r 3 * - ( ru - r U t - i )= st - **-i 表示利率差的变化. K ) 是线性 

的吗？进行非线性检验，并在5%的显著水平下得出结论. 

( c ) 对 {&} 建立一个门限模型，并检验所拟合的模型. 

( d > 对建立一个门限模型，并检验所拟合的模型. 
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第 5 章高频数据分析与市场微观结构 

卨频数据是指在细小的 N 间间隔上抽取的观测值.金融中常指以日或更小的时 
间 N 隔抽取的观测值.由于数据的获得与处理方法的进一步发展，这些高频数据目 
前是可以得到的，并且由于其在巾场微观结构实证研究方面的重要性而受到了广泛 
的关注.金融中最极端的高频数据是证券巾场中记录每一笔交易或贸易的数据•这 
里的时间通常以秒为单位测量.纽约股票交易所的交易行情数据库包含了整理过 
的从1992年至今的所有证券交易的 记录. 它包括了在 NYSE 、 AMEX 、 NASDAQ . 
以及美国在纽约以外地区的证券交易所的交易数据.伯克利 ( Berkeley ) 期权数据 
库为期权交易提供了从1町 6 年8月至 I " 6 年 I 2 月的类似 数据. 对于国内外其他 
许多证券以及市场的交易数据都是连续收集和处理的 . Wood (2000) 提供了一些关 
于高频金融研究的历史观察法. 

高频金融数据在研究与交易过程和市场微观结构相关的大量问题中都很重要 - 
可以用它们来比较不同交易系统（如 NYSE 的公开叫价系统和 NASDAQ 的计算机 
交易系统）在价格发现 (price discovery ) 方面的有效性；还可以用他们来研究某只 
特定股票买卖报价的动态性（如 Hasbrourk , 1999; Zhang , Russell 和 Tsay ，2001 b ). 
在一个指令驱动的股票市场（如台湾股市交易所）中，高频数据还可以用来研究指 
令动态，更有趣的是可以用它们来研究“是谁提供了市场的流动性”这样的问题 • 
Cho , Russell , Tiao 和 Taay (2003) 利用在台湾股市交易所中交易的 3 仙多只股票 
在一 灭中每 5分钟的收益率研究了设定日股价上下限的影响，并发现了向股价上 
限趋近磁效应的显著证据. 

然而，高频数据还有一些低频数据中不会出现的独特 特征. 因此对于这些数据 
的分析就给金融经济学家与统计学家提出了新的 挑战. 本章主要研究这些特殊的特 
征.考虑分析高频数据的方法并讨论所得结果的应用 • 特别地，我们讨论了非同步 
交易、买卖报价价差 ( bid-ask spread ) >持续期模型、大量小间隔上的价格运动以及 
关于价格变化和与价格变化相关的交易之间的时间持续期的二兀模型 • 所讨论的 
这些模型在其他科学领域（如通信和环境）的研究中也是适用的. 

5.1 非同步交易 

我们以对非同步交易的讨论开始.股票交易（如同 NYSE 中的一样）并不是同 
步发生的，不同的股票有着不同的交易频率；即使是同一种股票，其交易强度也是 
一小时一小时、一天一天地变化的.然而我们经常是对一个固定的时间间隔如一 
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天' 一周或者一个月来分析收益率序列.对于日收益序列，股价指的是其收盘价格. 
即该股票在一个交易日内最后一次交易的价格，而股票最后一次交易的实际时间也 
是一天天变化的.这样 1 如果我们假定口收益率序列在 2 4 小时里等间隔往往是不 
正 确的. 实践证明，这种假定可以导致，甚至是在真实的收益率序列是序列独立的 
时候，股票收益率可预测性的错误的结论. 

对于股票口收益率，非同步交易可以导致 ： （ a ) 股票收益率之间的一步延迟交 
叉相关； （ b ) 组合收益率的一步延迟序列 相关； （ c ) 某些情形下单只股票收益率序列 
的负序列相关.考虑股票 AH B . 假定这两 M 股票是独立的，并且股票 4 比股票 
B 的交易频繁对于在某天接近收盘时刻出现的一个特定的影响市场的消息，股票 
A 比股票 B 更可能在同一天中显示出这个消息的效应.这是因为 . 4 的交易更频繁. 
该消息对股票 B 的效应最终也会出现，但是可能会被延迟到下一个交易日.如果这 
种情况发生，则好像是股票> 1 的收益率引导着股票 B 的收益率•因此，尽管这两只 
股票独立，但是它们的收益率序列可能会显示出显著的一步延迟交叉相关件对于 
一个持有股票4与股票的组合，前面的交叉相关将会变成一个显著的一步延迟 
序列相关. 

更复杂的是，非同步交易也能引起单只股票错误的负序列相关.可以利用文献 
中的一些模型来研究这种 现象. 具体可参见 Campbell , Lo 和 MacKinlay (1997) 及 
其参考文献.这里我们采用 Lo 和 MMrKinlay (1990) 提出的模型的一个简化形式. 
令 r , 表示证券在 f 时刻的连续复合收益率.为了简便，假定 { rt } 是一个独立同分布 
的随机变最序列，均值 E ( r,J = /<、方差 Var ( r ( ) = a 2 . 对每个时间段，证芬不交易的 
概率为 7 T ， 它不随时间变化，并且弓 rt 独立•令「纟表示观测到的收益率，如果 t 时刻 
没有交易•则 r ?- 0 , 因为此时没有可以利用的信息•如果 f 时刻有一个交易，则我 
们定义 rf 为从前一个交易幵始的累积收益率（也就是说， + + 

其中知是满足在 t - kut - kf . 十 时刻没有交易发生的最大的非负整数 j 
r t 与 rf 的关系用数学式子表示如下： 




0, 

以概率 TT , 

rt , 

以概率 ( 1 - 42 ， 

n + n - “ 

以概率 (1 — 7 t ) 2 7 T , 

r t - n-1 + rt_ 2l 

以概率 (1 - ttJV 8 


以概率 (1 _ Tr ^ ir * 


(5.1) 


这些概率很容易理解.例如，汁 = r < 当目仅当/时刻与 f 】时刻都有交易发生: 
rf = r t + n _!, 当且仅当 t 时刻与 t - 2 时刻都有交易发生，但是 f !时刻无交易 






182 第 5 章高频數据分析与市场微观结构 


发生; r ? = rt + n ^+ rt - a , 当且仅当 （ 时刻与 t - 3 时刻都有交易发生，但是卜1 
时刻与2时刻无交易发生; 等等. 正如所期望的那样.总概率为1，由下式给出 

TT + (1 - ? r) 2 [l + 7T + 7 T 2 + *••] =7 T + (1 一 TT ) 2 】二 = 7 T +1-7 T = 1. 

我们准备考虑观测的收益率序列{^}的矩方程.首先 ，汗 的期望是 
B ( rf ) = (1 — ir ) 2 E ( r *) + (1 - 7 r ) 2 7 rE ( r t + r t - i ) + … 

= (1 — v) 2 fi 十 （1 — 7r) 2 7r2/i f (1 — ^) 2 7«^3/1 + •.. 

(5 2) 

= (1 - tt) 2 /i[1 + 2 丌 + 3tt 2 + 4 丌 3 + …] 

在上面的推导中，我们利用了结果：1 - H 27 T - K 37^+4^ + - = (二卢 .下—步，对 
于 rf 的方差，我们利用 Var ( r °) = E [( r ?) 2 ] - [ E(rf )] 2 ,以及 

E ( r ?) 2 = (1 7 r ) 2 E [( r t ) 2 ] + (1 - 7 r ) 2 7 rE [( r t + r t i) 2 l + ... 

=(1 - tt ^ K ^ + M 2 ) + 7 r (2< r 2 + 4/ x 2 ) + 7 r 2 (3 a 2 + 郎 2 ) + …] (5-3) 
=+27T + 37T 2 +...]}+ M 2 [1 +4^ + 971^ + ...]} (5.4) 

= " 2+ ^[ l ^- 1 ]- (5<5) 

在方程 （5.3) 中，我们利用了在 n 是序列独立的假定下式 成立： 

0 “） = var (自 e (自 rt_< ) ^+”—+叶+⑽. 

利用与方程 （5.2) 类似的方法,我们能够证明方程（5. 4 )的第一项可简化为 〆 .对 
于方程 （5.4) 的第二项,我们利用恒等式 

1 + 4tt 伶 2 4* 16rr 3 + … 

此恒等式 oj 以如下推出•令 

H = 1+ 47T 4- 9?r 2 4- 167T 3 + … 且 G = 1 + 37r + bit 2 + 7?r 3 + … . 

那么 （1 一 tt)H = G 且 

(1 - 7r)G = 1 + 2 tt + 27T 2 + 2 兀 3 + ... 

2 

= 2(1 + 冗 + 71^ + .，.）一 i = y ~ z — i. 




因此,从方程 （ 5.2) 与方程 （ 5.5) 中可以得出 

Var(r[*) = a 2 fx 2 ■ — lj — // 2 = tr 2 4 - J~~ - (5.6) 

下一步考虑彳叶 } 的一步延迟自协方差.这里我们利用 

Cov(r? ， r?^) = E(rf rfq) — E^JECrf.!) = 

则这个问题简化为寻找 Eir^). 注意到如果《时刻无交易或者 < - 1 时刻无交易 
或者 < 时刻与 f - 1 时刻都无交易，则 rOfO.j = 0. 因此，我们得到 

0, 以概率 27T —7T 2 ， 

r t r t -u 以概率 (1 一 7T ) 3 ， 

+ re_2), 以概率 (1 一 7r) 3 7r ， 

+r t _2+T*t_.3) ， 以概率 (1 — 71") 3 71 ^， 

. } (5.7) 

k 

r t ^ 以概率 (1 — 开 ) 3 # 工， 


总概率也是 1. 为了理解前面的结果，注意到 r ° r °_ 1 = rer ^ i 当且仅当在时刻 
« - 2, f - 1和 f 有三个连续的 交易. 利用方程 （5 J ) 以及对 j > 0, E ( r t r t _d = 
E ( r t ) E ( r t _ i ) = / i a , 我们得到 

ECr?^!) = (1 -tt) 3 lECrtr^jJ+TrElr^rt-a+n-aJlJ+Tr'E r t 十 …} 

= (1 — 7r) 3 /J? [1 + 27T j 37T 2 + … ] =(1 — n)fl 2 . 

{ r ?} 的一步延迟自协方差为 



Cov(r? ， rU = -7r/i 2 . (5.8) 

假定 / i 不为零，贝 1 j 非同步交易引起的 rf 的一步延迟白相关系数由下式给出 
Px ( r ° t ) = — ~ (1 ~ 咖 2 

H 、 tJ (1 一 TT)# 十 2?r/i 2. 

—般地，我们可以推广前面的结果，并且证明 


Cov(r t °, r?^) = -f?Tx\ j ^ 1. 

一步延迟 ACF 的大小依赖于//， 7 T 与 ( T 的选择.并且可以是真实的.这样，当# # 
时，非同步交易就导致了观测到的证券收益率序列之间的负自相关件. 
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前面的讨论可以推广到一个包含 AT 种证券的资产组合的收益率序列；见 Camp ~ 
bell , Lo 和 Mar.Kinlay (1997 .第3章).在时间序列文献中，非同步交易对于单个证 
券收益率的效应等价于关于一个时间序列的随机的时间积累，此时不交易的概率 t 
控制了积累的机制- 


5.2 买卖报价差 

在某些股票交易所（如纽约证券交易所)，做市商在促进交易方面起了非常重 
要的 作用. 他们提供了市场流动性 (market liquidity ): 每当公众有买卖的愿望时， 
他们随时都准备好进行买或卖.市场流动性是指能快速地、匿名地、几乎没有价格 
影响地买卖相当数量证券的 能力. 作为提供流动性的回报，交易所赋予做市商对证 
券的买卖双方传递不同价格的垄 断权. 他们以标价 A 购买，以更高的叫价 A 卖 
出（对公众来说， n 是卖出价格，巧是买入价 格）. 价格差& - n 称为买卖报价 
差.这是做市商获得报酬的主要来源_买卖报价差一般比较小，也就是一两个最小 
升降档. 

头卖报价差尽管数量上比较小，但是它的存在对于资产收益率时间序列的性质 
有几个重要的影响.我们这里主要讨论买实报价弹性，即买卖报价差引起的资产收 
益率的一步延迟负序列相关.考虑 Roll (1984) 的简单模型.假定观测到的资产市场 

价格巧 满足 q 

P t = P t *+/ e -, (5.9) 

其中<? = Pa _ Pb 表示买卖报价差，/ V 表示一个无摩擦市场中资产在/时刻的基 
木价值， {/ t } 是一个独立的、服从等概率二项分布的随机变量序列（即以概率 0.5, 
= 1；以概率0.5, / t = -1). 乃可以解释为一个指令型的示性变量，目取1表示买 
方发动的 交易； 取1表示卖方发动的交易 • 换一种说法,模型可以写为 

_ J +5/2，以概率 0.5. 

Pt = Pi [ \ _ 5 /2,以概率 0.5. 

如果 / y 不变，那么价格变化的观测过程为 

APt = (It — (5.10) 

在方程 (5.9) 对于 / t 的假定下，我们有 E (/ t ) = 0, Var (/ t ) = 1. 从而可以得到 
E(APt) = 0, 而且 


Var ( AP f ) = 5 2 /2, 

Co \( AP t , AiVi ) = -5 2 /4, 
Cov ( AP t , AP t _ i ) = 0, j > l . 


(5.11) 

(5.12) 

(5.13) 




因此，△巧的自相关函数为 
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Pj ( Ap t ) = 


-0.5，若 j = 1, 
0, 若 j ’ > 1. 


(5.14) 


这样买卖报价差就导致观测到的价格变化序列的一步延迟负相关，这在金融文献中 
一般称为买卖报价 弹性. 对此，我们可以从下面的直观意义上来理解.假定基本价 
格6•等于 （ P „ + A )/ 2 , 那么巧就有 几与八 两种取值.如果前面观测到的价格 
为 Pa (较高的值)，则当前观测到的价格要么不变，要么为巧，从而△巧要么为0, 
要么为- *5; 然而.如果前面观测到的价格为 n (较低的值)，则 Ah 要么为0,要么 
为 5. 的一沙延迟负相关变得很 明显. 但是，买卖报价差并小会引起任何超过 

一 步延迟的序列相关. 

—个更加现实的表示是假定 K 服从随机游动，满足 △" = P ;- PX 这 
形成了一个均值为0,方差为 cr 2 的独立同分布的随机变量序列，并且与 
独立， 在这种情形下， Var ( AP t ) = < r 2 +炉/2,但是 Cov ( AP t , AP t - j ) 是不变的，从 
而 

^(△朽)=^ 0 。. 

虽然△尸 t 的一沙延迟自相关的大小减小了，但是当 S - 忾 > 0时，负效应 
还是存 在的. 在金融中，研究买实报价差的组成比较有趣.感兴趣的读者可以参考 
Campbell ， Lo 和 MacKinlay (1997) 及其参考文献 • 

买实报价差的效应在组合收益率与多元金融时间序列中也是存在的我们考 
虑二元的情形，用 A = ( I lt J 2 t y 表示二元指令型示性变量，其中 /lf 是第一种证券 
的不性变置，/；«是第二种证券的示性变量•如果 / lt 与厶，是同步相关的则买卖 
报价差可以引起负的一步延迟交叉相关. 


5.3 交易数据的经验特征 

令表示资产的第/次交易发生的时刻，它是从午夜开始以秒为单位测量的 
曰历时间.有几个变量与交易相关 ，如： 交易价格、交易量、盛行的买卖报价等等. 
^的集合与相关的度量一般称为交易数据.这胜数据有几个重要的特征.这些特征 
当观测值随时间加总时不存在.下面我们给出一些特征. 

(1) 不等间隔的时间 区间： 交易（如交易所里面的股票 交易） 一般不是在等间 
巧的时间区间上发生的，这样观测到的资产的交易价格并不形成一个等间隔的时间 
序列.从而交易间的时间持续期变得非常重要，并且可能包含了关于市场微观结构 
(例如交易强度）的有用信息 

(2) 离散取值的 价格： 资产从一个交易到另外一个交易的价格变化只在最小变 
动价位的倍数中发生•在 NYSE 中，最小变动价位在1997年 G 月24日以前是1/8 
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美元，2001年1月29日以前是1/16美元.在 1 2 001年1月 M 日，所有的 NYSE 
和 AMEX 股票都开始以小数为单位进行交易，因此价格在交易数据中是离散取值 
的变量.在某些市场中，价格的变化也可能受监管者设定的条件的限制. 

(3) 日周期或者日模式的 存在：在正常交易条件下 ，交易 活动能够展不周期模 
式.举例说.在 NYSE 中，幵盘与收盘时刻的交易比较频繁，而中午时间交易比较 
少，导致 f “ U ” 型的交易强度.因此，交易之间的时间持续期亦呈现口循环模式. 

( 4 ) 一秒钟的多重交易： 多重交易.甚至是具有不问价格的多重交易同时发生 
是可能的.这部分是由于时间以秒来测量，而在大量交易期间，这种时间长度可能 
还是太长的事实. 

为了描述这些特征，我们首先考虑从1990年11月1日到1991年1月31日 
的 IBM 交易数据.这些数据来自于 TORQ ( TVades , Orders , Reports and Quotes , 即 
交易、指令、报告、报价）数据集，具体可参见 Hasbrouck (1992). 共有 63 个交易 
曰，60 328次交易 • 为了简化讨论，我们忽略了交易日间的价格变化，集中讨论发 
生在东部时间早上9: 3 fl 至下午4: 00的正常交易时间里的交易.众所周知，头天 
晚上的股票收益率与当天的收益率有显著不同，具体可参见 Stoll 和 Whaley (1990) 
及其参考文献.表 心1 以百分比形式给出了价格变化的频率.其中最小变动价位 
为$1/8- $0.125. 从表中我们做出以下结论 • 


表5^1 IBM 股票从1990年11月1日到1991年1月31日 
以最小变动价位的倍数变化的价格变化频率 



(1) 大约2/3的日交易是没有价格变化的； 

(2) 一个最小变动价位的价格变化接近于 H 交易的29%; 

(3) 只有2.6%的交易与两个最小变动价位的价格变化相关； 

(4) 只有1.3%的交易导致三个或者更多个最小变动价位的价格变化： 

(5) 正负价格变化的分布是渐近对称的_ 

下面考虑每5分钟的时间间隔上的交易量•用 A 来表示此 序列. 也就是说，:^ 
表示在1990年11月1日 ， IBM 从上午9: 3 0至 9 : 35 的交易量：勿表示 IBM 从 
上午9: 35至9: 40的交易量， 等等. 忽略交易日之间的时间 间隙图 画出了 
Xt 的时间序列图.图 5 -lb 描述了 延迟一阶至 26 0阶的样本 ACF 尤其有趣的是 
ACF 的周期为78的循环模式，这正好是一个交易日内每 5 * * * 分钟间隔的数量这样， 

交易量呈现出日模式.为了更进一步地描述日交易模式，图 5 2 画出了 63 天的每 

5分钟的平均交易量，共有78个这样的平均数.这个图形呈现出“微笑”形状或者 

“ U ” 的形状，表明在市场幵盘与收盘的时候交易多，而亇时交易少的 特点- 
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图 5-1【 BM 从 1990 年 11 月 1 日至 1991 年 1 月 31 日的日交易数据: 
( a ) 每5分钟间隔内的交易 次数； （ b ) ( a ) 中序列的样本 ACF 



图 5 -2 每 5 分钟间隔的平均交易次数的时间图对 IBM 股票从 1990 年 11 月 1 日 
至 1991 年 1 月 31 日共 63 个交易日的平均，共 78 个观测值 

因为我们着重讨论在一个交易日中的正常交易时间发生的交易，故在数据中 
总共有 5 9 838 个时间 间隔. 这些间隔称为交易之间的日持续期.对 IBM 股票，有 
6 531个零时间间隔.也就是说在从1990年11月1日至1991年 I 月31日之间的 
63个交易日的正常交易时间内，每秒钟的多重交易发生了 6 531次，大约是10.91%. 
在这些多重交易中，有 L 002 个有着不同的价格，这大约是全部日交易量的1.67%. 
因此，多重交易（即零息持续期）可能会成为交易之间的时间持续期统计模拟中的 
一个问题. 

表5> 2 提供了价格运动的两种分类方式.这里，价格运动被分成“上升”、“不 
变”、吓降”三类，我们将它们分别表示为“+”，《()”* “一”.此表给出了样本在两 
个连续交易日内（从第 i -1 个交易日至第 i 交易日）的价格 运动. 由表中，交易对 
交易的数据表明： 


(«) 


1308()涊200 
1 §^ 
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裹 5-2 

第 G — 1) 次交搞 


边缘 


IBM 股票相邻两个日内交易的价格变动的分类》 

第 V 次交易 



5 498 
29 779 
4 841 


3 948 
5 473 


831 


边缘 



a 价格运动分成“上升' “不变”、1降” 3类.数据的时间 K 间为 19UU 年11月1 n 到1991年1 
月31日. 


(1) 连续的价格递增或者递减的情形是相当少的，分别是441/59 837=0.74%, 
410/598 37=0.69%; 

(2) 从表的第1行看出，有轻微的从“上升”到“不变•’而不是到“下降”的移 
动； 

(3) 价格保持“不变”的倾向 很高； 

(4) 从第3行可以看出，从吓降”到“上升”或者“不变”的概率大致相同. 

前面提到的第一个观测就是买卖报价弹性的一个清楚的说明，显示了日交易数 

据的价格逆转为了确认这个现象，我们考虑价格运动的一个方向序列认.在第 i 
次交易中，对于价格上升、不变、下降三种情况， A 分别取+1、0、1三个值.{£>，} 
的 ACF 在延迟为1时的取值 0.389 是一个单峰，这对于样本大小为59 837的序 
列来说是高度显著的，从而证实了连续交易中的价格逆转. 

作为第一个解释，我们考虑由 TAQ 数据库得到的 IBM 股票在1999年12月 
的夂易数据.止常的交易时间是从东部时间早上9: 30至下午4: 00, 12月31日 
这天除外，因为这天市场在下午1: 00关闭.与 1990-1991 年的数据比较，发生 
了两个重要的变化.首先，日交易次数增加了 6倍，仅在1999年12月就发生了 
134 120次交易.交易强度的增加也给每秒钟的多重交易增加了机会.零时间持续 
期的交易百分比增长了两倍.增长到了 22.98% . 更为极端的是，1999年12月3日 
在给定的一秒钟内发生42次交易的情形出现了两次.其次，价格运动的最小变动 
价位是1/16美元 =0.062 5美元，而不是1/8美元.最小变动价位的变化降低了买 
卖报价差.图 5-3 给出了新样本的日交易次数.图 5-4a 是以秒为单位测暈的交易 
时间持续期的时间图.图 5~4b 是用最小变动价位1/16美元的倍数测量的连续日 
交易的价格变化图.正如所预期的，图 5*3 与图 5-4a 很清楚地说明了闩交易次数与 
交易的时间间隔之间的逆转关系.图 5-4h 描述了 1999年12月3円 IBM 股票的 
两个不寻常的价格 运动： 其一是先下降了 63个价位.紧接着上涨了 64个 价位； 其 
二是下降68个价位后，紧接着上涨了 68个价位.在一个交易日中，像这样不寻常 
的价格变化是很少发生的. 
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图5~ 3 linw 年12月 IBM 的交易 数据. 图中给出/每个交易日的交易数,其中有的长条加 
上了标记时间为当天下午 4 : 00以后发生 （ after - hours ) 的交易数 
⑷ 



0 20 000 4() ( KX ) C 0 000 SO ()00 1( X 1 ( XX ) 120 000 

汴列 


图 5-4 1999年12月 IBM 的交易数据 .（ a ) 交易之间时间持续期的时间图 （ b ) 以最小变 

动价位1/16美元的倍数测量的连接两个交易的价格变化量的时间图.只包含正常 
交易时间的数据 

对于在正常的交易时刻中记录的交易，在133 475个交易中有61 149个交易 
没有价格变化.这大约是45. 8 %，比1"0年11月到1991年1月这个时间段上的 
没有价格变化的交易数少 很多. 看上去是减少最小变动价位增加了价格变化的机 
会.表5~3给出了与价格变化相关的交易数的百分比.价格运动仍然近似地关于0 
对称.日交易中很大的价格变化仍然相对很少. 


表与1999年12月交易的 IBM 股票的价格变化相关的日交易百分比《 





mm 

mem 
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a 在正常的交易时刻.没有价格变化的交易的百分比为45.8%,总文易量为133 4 T 5. 这个人小是以璀 
小变动价位1/16美元的倍数测童的. 
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注释：高频教据的保存记录并不像以较低频车抽取的观测值那么好.冈此，在 
高麺數据分析中，猙有必要进行數据清理.对子交易數据.很多方式都可以造成观 
测值的缺失，从而对某些交易而言.精确交易时间的正确程度是值得怀疑的.例如, 
所记录的交易时刻也可能超过东部时间的下午4: 00,甚至超过下一天正常交易时 
间开始 之前. 怎样处理这些观測值值得仔细研究.教据清理的一个适当方法要求对 
市场操作的方式有很深的 理鲜. 因而.清楚准确地鉴定教掂清理中使用的方法非常 
重要.在做出推断之前，必须考虑这些方法. 口 

另外，令表示从午夜开始以秒力单位测量的笫 i 次交易发生的日历时间 ，巧, 
表示交易价格.从第 *- J 次交易至第*次交易的价格变化为讲三 APt . = Pt , 

时间持续期为 △匕 = U - «<_!. 这里理解为 ，△匕与讲 的下标表示交易的时间序列， 
而小是日历时 N . 在卜面的讨论中，我们主要考虑％与 Ai , 的单个模型与联合模 
型. 


5.4 价格变化模型 

离散化与集中于“无变化”这两个性质使得我们对日价格变化建模比较闲难. 
Camphell , Lo 和 Markinlay (1997) 讨论了文献中已经提出的几种计量经济模型.在 
这里，我们提及两种利用解释变量来研究 R 交易价格变化的模型.第一个模型是 
Hauseman ， Lo 和 Mackinlay (1992) 在研究交易数据的价格运动中使用的顺序概率 
值模型.第二个模型最近由 McCulloch 和 Tsay (2000) 提出.此模型是 Rydberg 和 
Shephard (2003) 提出的模型的一个简便形式，也可以参考 Ghysels (2000). 


5.4.1 顺序概率值模型 

令％表示所研究的资产的不能观测到的价格变化（也就是说，乂 = /^ PD 
其中尸表示资产在 f 时刻的真实价格.顺序概率值模型假定是一个^续 I ^随 
机变量，服从以下模型 


y ；= XiP ^£ i , (5.15) 

其中:^表示时刻可以得到的解释变量的 P 维行向量，卢是一个 fc x 1 参数向 
量， E ^ Ijb ^) = 0, Var(e<|a:<) = tr?, 并且对于 i 〆 Cov(c*, Cj ) = 0. 假定条件方差 
ol 是解释 变置叫 的正函数 .Bfl 

or ? = (5.16) 

其中 g ㈠ 是一个正函数.对于金融交易数据而言，可能包含了时间间隔 U - ti-i 
以及某些条件异方差变量.特别地，也可以假定^在给定^和下的条件分布 
是高斯的. 
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假定观测到的价格变化 讲有 k 个可能的取值，理论上 fc 可以是无穷大，但必 
须是可数的.实际应用中， A : 是有限的，可能涉及将几种类别组合成单个值.例如， 
在表 5-1 中我们有 k = 7 , 其中第一个值 “-3 价位”意味着价格的变化为 -3 个价 
位或者更低，我们将个可能的取值表示为 { Sl ，勿， ... , s k }, 则顺序概率值模型假 
定 ZA 与之间的关系为 

Vi = 若 〈 2/: < <7* = 1， •.. ，左， (5.17) 

其中％ 是实数，满足 ——oo — ao < ai < •" < cxk-i < ock = oo . 在条件高斯分布的 
假定下，我们有 


p(yi = 5j|xi,tDj) = P{otj-i < Xip + £i < 


十 彡 c ^ la ^ Wi )， 若 j = 1, 

P { aj-i < Xi /3^ Si ^ aj \ xi , Wi ), ^ j = 2，"， fc - l , 
尸 ( ttfc-i < + e ,| aj <, Wi ), 若 j = k , 


L 。“叫）」 

L 咖 ‘）J L 咖 ‘ ） J ， 

L ^i) J 1 


若 j = i , 

若 j = k , 


(5.18) 


其中中 (： c ) 是标准正态随机变量的累积分布函数在 i 点的取值.并且我们用 a t ( Wi ) 
表示疗是叫的正函数.从定义中可以看出，顺序概率值模型是由未观测到的连续 
随机变量所驱 动的. 观测值都有一个自然序号，可以认为是代表所在过程的类别. 

顺序概率值模型包含了参数/3, aji = 1,-•• . A : - 1) 以及方程 （5.16) 中条件方 
差函数 ai ( w t ) 包含的参数.这些参数可以通过最大似然估计或者是 MCMC 方法 
来估计. 

例 5 .1 Hausoman , Lo 和 Mackinlay ( lM 2 ) 对1明8年 100 多种股票的交易数据 
应用了顺序概率值模型，这里我们仅描述他们对于 IBM 的结果，共有206 794个 
交易. 价格变化 ja 的样本均值（标准差）为 -0.001 0 (0.753), 时间持续期 Ai , 的 
样木均值（标准差）为 27.21 (34.13), 买卖报价差的样本均值（标准差）为 1.947 0 
(1.462 5). 买卖报价差是用最小变动价位来测量的.运用的模型对于价格运动有很 
好的分类，而且指定函数为 


3 3 3 

^ I I ； + 乳十 4 SP5，_ W 十十 ylBSt-j ； 


V =1 
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+ X )凡 + 10 【 rA ( M -«) x (5.19) 

V=1 

cr ?( t «,) = 1.0 + 7 i + 72 ABi _!, (5.20) 

其中 T X { V ) = ( V x - 1)/ X 是指对于 A e [0, lj 的 K 的 Box - Cox 变换.解释变童定 
义如下. 

• = (« i - i <- i )/ l 00 是第卜1次交易与第 i 次交易之间尺度修正的时间 
持续期，这里时间是以秒为单位测量的. 

• AB ,^ 是时刻流行的以最小变动价位计算的买卖报价差. 

• ?/,- w ( v = 1,2,3) 是时刻以最小变动价位计算的价格变化的延迟值.对 

于 A : = 9,以最小变动价位计算的价格变化的可能取值为 {-4, 3, 2, 1, 

0,1,2, 3,4}. 

• V；_,,( V = 1， 2 ,3) 是第次交易中交易额（美元数）的延迟值，定义为笫 
i - v 次交易的芙元价格乘以交易股份数（股数己经除以100 了).即，美元 
数以百为单位. 

• SP 5 i_ v (v = 1,2,3) 是标准普尔 5 UU 指数.在与第 i — v 次交易发生的月份 
最靠近的那个月到期的期货价格每5分钟连续复合收益率.这里的收益率 
是用以前的最近取整时间的前1分钟和前5分钟记录的期货价格来 
计算的. 

• IBS ,_ v ( V = 1,2,3) 是一个示性变量，定义为 

1，当 Pi-v > ( Pt- V + Pi — v )/2, 

IBS ㈠ … 0 ， 当 Pi- v = { Pt - v + Pi b - v )/2, 

.-1， 当 Pi - v <( P ^. v + P ! L v )/2, 

其中 P /，0 分别为 G 时刻的卖价与买价. 

表5- 4 给出了参数估计以及它们的比.除了一个比较小以外，其余比 
都很大，这显示了估计是髙度显著的.因为样本的容量很大，所以如此高的 f - 比并 
不令人感到惊奇.对于夂易量很大的 IBM 股票而言，估计结果显示出如下结论_ 

(1) 边羿的划分并小是等间隔的，但是关于0几乎是对称的. 

(2) 交易的持续期 △«, 不仅影响方程 (5.19) 表示的队的条件均值，而且影响 
方程 （5.20) 表示的队 的条件方差. 

(3) 延迟价格变化的系数为负并且是高度显 著的. 显示了价格逆转性质. 

(4) 如所料想的，时刻的买卖报价价差显著地影响条件方差. 
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表 5-4 对 IBM 股票1988年的交易数据，方程 （5.19) 和 （5.20) 中的 
顺序概率值模型的参数估计，其中 t 表示 t - 比 a 

概宇倌 描 细的边 界分解 


参数 


估计 -4.67 -4.16 

« 一 145. 7 — 157.8 


-3.11 

-171.6 


一 155.5 


1.33 

154.9 


3.13 

167.8 


152.2 


138.9 


概率值模甩的方秤参数 


参数 

估计 0.40 

t 15.6 


0.52 

71.1 


fli Af ； 
- 0.12 
-11.4 


/3 a 


i fis 04 

-1.01 -0.53 -0.21 

-135.6 -85.0 -47.2 


05 


-0.26 

- 12.1 


参数 


07 


ft 


09 • 


010 


012 


013 


估计 


0.01 


-63.6 


-0.37 

- 21.6 


-U.J7 


47.4 


a 已经被 


授扠复印. 


5.4.2 分解模型 

对价格变化建模的另外一个方法是将价格变化分解为3个组成部分.然后运 
用每一部分的条件 确定. 具体叫参见 Rydberg 和 Shephard (2003) .这3个部分分 
别为价格变化的示性量、有价格变化时价格变化的方向以及价格变化发生时变化 
的 大小. 具体来讲,在第 i 次交易中的价格变化可以写为 


Vi = Pti - = AiDiSi , 

其中木是一个二元变量，定义为 

^ f 1,如果第 i 次交易中有价格变化， 

' 1 0,如果第 i 次交易中无价格变化. 

D , 也是一个离散变量，它表示有价格变化的时候，价格变化的方向，即 

^ &次交易中价格上升， 

K 第〖攸易中价格下降. 

其中 Di\{Ai = 1) 意思是说 R 是在 A , = 1的条件下定义的•当第 i 次交易中有价 
格变化 B 、 j , $指最小变动价位的 大小； 当第；次交易中没有价格变化时. 况 =0.当 
有价格变化时，&是一个止的实值随机变童. 

注意到次= 0时，不需要 A ， 并且在分解中有一个自然的次序.只有当次=1 
时， A 才有 定义； 只 有当息 =1并且给定 A 的条件下，氏才有意义.分解中模型 
的确定利用了这个次序. 


(5.21) 


(5.22) 


(5.23) 
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= /3b 十 0iAi~i t 
= 7D + 7lA-l, 

) = 没 11，0 f O u ,iSt- 


(5.30) 


利用方程 （5.29) 中的对数似然函数得到的参数估计在表 5-5 中给出.估计得到的简 
单模型显示了价格变化中的某些动态依赖件.尤其是， TRM 股票的交易对交易的价 
格变化呈现出许多如下吸引人的性质 


对于 j = 1， 2 ,3,令/ 心) 表示前面三类的示性变量，也就是说，当第 j 类发生 
时, Ji ( j ) = 1，当第 j 类不发生时，以 j ) = 0.方程 (5.24) 的对数似然函数为 

14P( Wi |L /,( l ) ln[(l + 

+ In(Vi) + (5*-l)ln(l-A u , < )] 

+ / < (3)[ ln ( p ,)+ ln ( l -<5 i )- f - ln ( A “， ‘）+ ( 况一 1 ) ln(l - A ^)] 

并且全部的对数似然函数为 

n 

)!/ n |^ o )] = y ^ ln [ P (^|^- i )], (5.29) 

i =\ 

这是 参数汍 7, 以及心的一个函数. 

例 5.2 我们通过解释 IBM 股票从1990年11月1日至1991年1月31日的日 
交易来说明分解模型.共有63个交易曰，在正常的交易时间内发生了 59 838次日 
内交易.运用的解释变暈如下. 

(1) A 上一次交易的行动示性变量（也即在一个交易日内的第 i — l 次交 

易). 

(2) A - i . 上一次交易的方向示性变量. 

(3) Si — l : 上一次交易的大小. 

(4) Vi - r . 上一次交易的成交量除以 1000. 

(5) 从笫 i 一 2次交易到第 i - 1次交易的时间持续期. 

(6) BAi ： 交易时刻的买卖报价价差. 

囚力我们利用的是延迟为 i 的解释变童,所以实际的样本大小为59 775. 对十所试 
用的模型 K_ l t 与都不是统计 M 著的，从而我们只运用了前三个解释变 
量.采用的模型为 
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Di 1 = D (即 = 0)， 

Di—i — l,Ai~ 1 , 

D % —1 —.1， ： ^ = 1. 


) 0.483, 
0.085, 
0.904, 


这个结果说明 

① 如果第/ - 1次交易中没有价格变化，那么在第 i 次交易中价格上升和 
下降的机会是平 等的； 

② 连续的价格上升或者价格下降的概率非常低.给定第 i _ l 中交易上升 
而且第 i 次交易中价格发生变化的条件下，第 i 次交易的价格上升的概 
率仅仅只有8.6% . 然而，在给定第 i - 1次交易中下降而且第；次交易 
中价格发生变化的条件下，第 i 次交易的价格上升的概率大约为90% . 
因此，这个结果显示了买卖报价弹性的影响，支持了高频数据交易中的 
价格逆转. 

(3) 只有很弱的证据表明大的价格变化有更大的可能性跟随另外一个大的价格 
变化，考虑价格增长的大小，我们有 

Si\(Di = 1) ~ 1 + g{X u ,i), \ u<i = 2.235 - 0.670 况 _!• 

利用几何分布的概率质量函数,我们得到如果交易导致一个价格增长而且6’^ = 1， 
那么在第次交易中，价格增长一个最小变动价位的概率为 0.827 .当 Si - x =2^, 
此概率下降到0.709,当=3时下降到 0.556. 因此,给定第，次交易屮价格增 
长的条件下，一个大况的概举与成反比. 

ADS 模型与顺序概率值模型的一个区 别是： ADS 模型并不要求价格变化大小 
中的任何截断或者分组. 


^ 5-5 方程 （5.30) 中对 IBM 从1990年11月1日到1991年1月31日的日内交易 
ADS 模型的参数估计 


参数 

00 

01 

70 

71 

0«.0 

Bu.i 

0d.o 

0丄1 

估计 

标准差 

一 1.057 

0.104 

0.962 

0.044 

一 0.067 

0.023 

一 2.307 

0.056 

2.235 

0.029 

一 0.670 

0.050 

2.085 

0.187 

-0.509 

0.139 


(1) 价格变化的概率依赖子上一次的价格变化.具体地.我们有 


P(Ai = l|i4j_i = 0) = 0.258, P[A t = l|Ai-i = 1) = 0.476. 

这个结果显示价格变化的发生是聚类的.正如所料想的，大部分交易没有价格变化. 
当在第 i - 1次交易中没有价格变化时，则在随后的交易中，只有大约1/4的交易 
有价格变化：当在第 ^-1 次交易中有价格变化时，在第 i 次交易中，价格发生变化 
的概率增加为大约 0.5. 

(2) 价格变化的方向由下式控制 


ml/ 31/ gf v 

如如如 
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5.5 持续期模型 

持续期模型主要考虑交易之间的时间间隔.较长的持续期预示着较少的交易活 
动.这反过来又表明了一个没有新消息的时期.这样，持续期的动态行为就包含了 
关于日内市场活动的有用信息.利用类似于波动率的 ARCH 模型的概念， Engle 和 
Russell (1998) 提出了自回归条件持续期 ( ACD ) 模型来描述股票（尤其是大量交易 
的）时间持续期的演变 . Zhang , Russell 和 Tsay (2001 a ) 扩展了 ACD 模型来解释 
数据中的非线性性与结构 突变. 本节引进了一些简单的持续期模型.正如前面提到 
的，日内交易展示了一些日模式.因此，我们集中讨论调整的时间持续期 

^ t m i = ^ U / f { U ), (5.31) 

其中 m 是一个确定的函数，有 △£, 的循环成分组成.显然 nu ) 依赖于标的资产 
(underlying asset ) 以及市场的系统行为.实际应用中，有很多估计 f ( U ) 的方法.但 
是根据统计件质没有一种方法总是优于其他方法的.光滑插值是一个通常的方法， 
这里我们运用简单 的一次 插值函数与示性变量来处理日交易活动中确定的组成部 
分. 

对于用来解释 ADS 模型所采用的 IBM 股栗数据，我们假定 

7 

/( ti ) = exp [ d ⑹]， d{ti) - A ) + [(5.32) 


其中 


她)= 

-43 200\ 2 

V 14 400 ) } 

- | 

f fU - 38 700\ 2 

V 7 500 ) ' 

卜， 

若 

若 

ti < 43 200. 

U 200, 

,2(幻）= 

-48 300)2 
\ 9 300 ) 1 

MU ) = | 

[ /匕-48 600、 2 

V 9 000 ) 1 

卜， 

若 

若 

t * ^43 200, 

U <43 200. 


/ s ( M 与 fe ( t ,) 是市场开盘时第一个 5 分钟与第二个 5 分钟的示性变量，[即 九 ㈠ 一 
1当 R 仅当&在东部时间的上午 9 : 30至上午9: 35之间 ]. MU ) 指日交易的最后 
30分钟的示性值，[即 f 7 ( U ) = 1当且仅当交易发生在东部时间下午3: 30至下午 
4 : 00]. 图 5 _ 5 给出了对于1，2,3,4,厶 ㈠ 的图形，其中轴的时间刻度是分钟. 
注意到/ 3 (43 200)- / 4 (43 200), 艽中43 200对应于中午12点. 

方程 (5.32) 中的系数爲可以通过线性回归的最小二乘法得到 

7 

In ( A ^) - /? 0 + 




198 第 5 幸高频數据分祈与市场微观结构 


010 20304050 607080 
5分钟的区间 


0 1020 304050 60 7080 
5分钟的区间 


m 5-6 IBM 从1990年11月1日到1991年1月31日的交易数据：⑷每5分钟时间 
间隔的平均持续期 . 对确定成分调整之后的每5分钟的平均持续期 



(I 100 200 3 (MI 4( K ) 

分钟 

(b) 


0 100 200 300 400 

分钟 

(d) 


0.0 
- 1.0 
- 2 . 0 -< 



0.2- 


/ ^ 


/ 

一 1.0. 

\ 

1 1 雪 1 1 


0 1( K ) 20 U 300 400 

分钟 


2( K ) 300 40 U 

分钟 


m 5-5 用 来消除 IBM 曰内交 易持续期的确定成分的二次函数： 

( a )—( d ) 分别是方程（5.3 2 )中的 M ) 到/ 4 (-) 

拟合的模型为 

In ( A ^) = 2.555 十 0.159^(1*) + 0.270/2( t <) 十 0.384/3( t <) 

+ 0.061/ 4 (/,*) - 0.611/ 5 («0 - 0.157/ 6 (0) + 0.073/ 7 (ti). 

图 5^6 给出了 63 个交易日中每 5 分钟时间间隔的平均持续期的时间图，包括 
对于确定性部分调整前以及调整后的图形.图 5-6a 为的平均持续期，正如我 
们所料想的，它展示了一个每日模式.图 5~6 b 为的平均持续期（也就是调整 
延迟的时间持续期)，每日模式大大地消减了. 
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5.5.1 ACD 模型 

自回归条件持续期 ( ACD ) 模型利用 GARCH 模型的思想来研究方程 （5.31) 中 
调整的时间持续期的动态结构.为了记号的简便，我们定义:= At ；. 

令叭= E ^ lF ^ x ) 表示第^ - i 次交易至第次交易的调整的时间持续期的 
条件期望.其中 Fi -! 为第 i - 1次交 易时町 以得到的信息集合.换句话说，汍为给 
定的条件卜期望的调整持续期.基本的 ACD 模型定义为 

而 = ^tcu (5.33) 

其中 { e <} 是独立同分布的非负随机变量序列满足 E (£ i ) = 1.在 Engle 和 Russell 
(1998) 中， q 服从一个标准指数分布或者是标准化的韦布尔 ( WeibiiU ) 分布，并且 
认假定为以下形式 

r a 

也= u ; 十芝^ Jjxt - j - + ^2 (0.34) 

i-i 

这样一个模型可以称为 ACD ( r , a ) 模型.当服从一个标准指数分布时，结果中的 
模型称为 EACD ( r ,.5) 模型类似地，如果 e < 服从标准化的韦布尔 （ Weibull ) 分布， 
则称为 WACD ( r ,«) 模型.有必要的话，读者可以参考附录 A , 对指数分布与韦布尔 
分布进行一个一个快速的回顾. 

与 GARCH 模型类似，过程叫 = Xi _啦 是一个鞅差序列[即 E ( r / i | F i _ 1 ) = 0], 
ACD 模型可以写为 

max(r t «) 8 

而 =w + H hj + + Vj , (5.35) 

i=i i=i 

这正好是没有高斯新息的 AR . MA 过程的形式.此处，对于 j > r , 7i = 0;对于 
j > s , ujj = 0. 可以用这样的表示来得到 ACD 模型弱平稳性的基本条件.例如，对 
方程 （5.35) 两边取期望，并且假定弱平稳性，则我们有 

E(Xi) = 1 

因为期望持续期是正数，所以我们假定 a ; > 0, 1 > E (% +叫).作为方程 （5.35) 的 
另外一个应用，我们研究一下 EACD (1,1) 模型的性 
EACD(1 ， 1 ) 模型 
—个 EACD (1,1) 模型可以写为 

*» = t /> 4 = u ? + 7 i**-i ■+■ (5.36) 

其中 £,• 服从标准指数分布.利用附录 A 中标准化指数分布的矩，我们有 
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E ⑹ =1 ， Vax ⑹ =1 ， E(e?) = Var(£ i ) + [E(e i )] 2 = 2. 

假定 A 是弱平稳的（也就是说 a 的头两阶矩不随时间变化)，那么我们可以导出 
^的方差.首先对方程 (5.36) 两端取期望，我们有 

E(a ： i) = E[E('^i£i|Fi_i)] = E ( 呶 ) ， E ⑽）= w + 7iE(«i_i) +wiE(^i_i). (5.37) 

在弱平稳性的条件下， E (咖）= E(V»i-i), 因此方程 (5.37) 给出 

= E(xg) — E (也 ）=-- . (5.38) 

1 — 7 i — wi 

又因为 E ( d ) = 2, 我们有 

E(x?) = Et 晰伽 -i)J = 2E ( 蚜 ) . 


在方程 （5.36) 中对也的 T 方取期望，并且利用也和 x , 的弱平稳性质，通过某些 
代数运算.得到 


= / i * x 


1 - (7i +W!) 2 
1 - 27? _ - 271^1 


(5.39) 


最后，利用 VarOti ) - E ( x ?) - [ E ( x ,)] 2 , E ( a : J ) = 2 E _, 我们有 




其中以如方程 (5.38) 中 定义. 这个结果显示，为了得到时间不变的无条件方差，方 
程 (5.36) 中的 EACD (1，1) 模型必须满足1 > 2 7 ?十4 +2 71 (外 WACD (1，1) 模型 
的方差可以利用同样的方法以及标准化韦布尔分布的前两阶矩得到. 


带有广义伽玛分布的 ACD 模型 


在统计文献中，强度函数经常根据危险率函数来表示.正如附录 B 中所示， 
EACD 模型的危险率函数随时间不变.而 WACD 模型的危险率函数是一个单调函 
数.这些危险率函数在实际应用中相当受限制，因为股票交易的强度函数可能不固 
定，或者不随时间单调变化.为 f 增加相应的危险率函数的灵活性， Zhang , Russell 
和 Tsay ( 2() 01)对采用了一个（标准化的）广义伽玛分布.对于广义伽玛分布的 
基本性质可以参见附录 A . 结果中的危险率函数可以假定不同的模式.包括 U 型或 
者倒转的 U 型.我们将新息服从广义伽玛分布的 ACD 模型称为 GACD ( r , a ) 模型. 


5.5.2 模拟 


为了说明 ACD 过程，我们利用的两种不同的新息分布，从 ACD (1，1) 模型 


Xi = Vi = 0.3 + 0.2 x t _x + 0.7 必 i_i 


(5.40) 
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中产生了 500个观测值.在第一种情形中，假定^服从参数《二 1.5 的标准化的韦 
布尔分布;在第二种情形中，假定服从参数 k = 1.5, a = 0.5 的一个（标准化的) 
广义伽玛分布. 

阁 5-7a 给出了 WACD(1,1) 序列的时间图•图 5~ 8 a 为 GACD(1,1) 序列的时间 
图.图 5 - 9 描绘出了两个模拟序列的直方图.两个模型的区别是很显然的.最后，在 
图 5-10 a 与图 5 -llb 中，我们分别给出了两个模拟序列的样本 ACF , 从中可以清楚 
地看到序列的相依性. 


(«) 模拟的 WACDU, 1) 序列 



IOU 2tK) ;«KI 4LKJ rj()(| 
时间指数 

(1»)标准化的残差 



0 100 2(K) 30() 401) 5(K) 

时间指数 


由 (5.40) 式模拟的 WACD ( l . l ) 序列： （ a ) 原始序列: 
( b ) 估计后的标准化序列.共有500个观测值 


(n ) 模拟的 nA(T)(1.l) 序列 




0 10(1 200 36() 400 &(')() 

时间指数 

(l») 准化的残差 




2(H) 300 4UO 0UU 

时间指数 


由 (5.40) 式模拟的 GACD (1,1) 序列： （ a ) 原始 序列: 
( b ) 估计后的标准化序列.共有50(】个观测倌 


赛想 ite 摧龙 


i« 


图 


怎 2( lfl („ f 8 

S 邾& 钯龙 5- 
阁 
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( a ) ( b ) 



图 5*9 具有 500 个观测侑的模拟的持续期过稈的直方阁： （ a) WACD(1,1) 模型; 
(b) GACD(1,1) 樓型 


图 5-10 


0.4 


- 0.2 


0.4 

0.2 

().0 

- 0.2 


( a ) 原始序列 


I III ■ 


10 15 20 25 

问隔 

( b ) 标准化的残差序列 


• 2(1 


具有500个观测值的模拟 WACD(1,1) 序列的样本自相关函数： （a) 原始 序列; 
(b) 标准化残差序列 


5.5.3 估计 


对子 ACD(r, a) 模型，令 t‘ u = max(r,a), x t = (xi , - - • , x t y . 持续期 xi ,x 2 , ••- , x r 
的似然函数为 

T - 

/(* T |0)= {I f(xi\Fi. 1} 0) x/(* io |0), 

十 1 - 

其中 0 表示模型的参数向量， T 表示样本大小.前一个方程中的边缘概率密度函 
数 f ( x io \0 ) 对广义的 ACD 模型而言相当复杂.因为它对似然函数的冲击是随着 
样本大小 T 的增加而递减的，边缘密度通常忽略/这一点,从而导致了条件似然方 
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其中 a = r(«)/r + 参数向量 0 也包含心如我们料想的，当《 = 1， 

A = 1/rfl + g 时，方程 (5.42) 中的对数似然函数简化为方程 (5.41) 中模型 
WACD ( r ,«) 的&然函数形式.这个对数似然函数可以改写为许多形式来简化估计. 

在某些正规性条件下，条件最大似然估计是渐近正态的，具体可参见 Engle 和 
RusseU (1998) 及其参考文献.在实践中，一旦指定了持续期模型.对于感兴趣的问 
题可以用模拟的方法得到有限样本的参考分布. 

例 5.3( 模拟的 ACD (1,1) 序列的继续）考虑方程 (5.40) 中模拟的 WACD (1,1) 序 
列以及 GACD (1,1) 序列，利用条件似然方法得到的结果列于表心6中，估计看上去 
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序列 

图 5-12 在 1990 年 11 月的前5个交易口交易的 IBM 股票持续期的时间图： （ a ) 调整的 
序列； （ b ) WACD (1,1) 模型的标准化 新息. 其中有3 534个非零的持续期数据 


是合理的.令 V 〕,表示叭的1步向前预测，& = xj ^ i 为标准化的序列.可以认为 
是^列标准化的残差.如果模型已充分确定，应该以独立同分布随机变量的形 
式运动•图 S-7b 与图 5~8b 显示了两个模型厶的时间图.拟合的两个模型 的心的 
ACF 分别在图 5-10 b 与图 5- llb 中 给出. 很显然在&序列中没有发现显著的序列 
相关. 

表6~6 对横拟的 ACD (1,1) 模型的 500 个观测值序列的估计 结果： 

( a ) WACD (1,1) 序列； （ b ) GACD (1,1) 序列 



例 5 . 4 作为持续期模型的说明，我们考虑 IBM 股票从 1990 年 11 月 1 日至 1990 
年 11 月 7 日连续 5 个交易日内的交易间的持 续期. 集中于正的交易持续期.我们 
共有 3 534 个观 测值. 另外,将数据作了调整，消除了方程 (5.32) 中的确定成分.也 
就是说，我们采用了方程 (5.31) 中定义的 3 534 个正的调整持续期. 

图 5-12a 给出了 1990 年 11 月的前 5 个交易日内调整的 （正的） 持续期，阁 
5-13a 给出了序列的样本 ACF. 在调整的持续期中.还存在一些序列相关性.我们 
对数据拟合一个 WACD(1，1) 模型.得到的模型为 

工< = 知 “ = 0.169 + 0.064^4 + 0.885-0*-!, (5.43) 



4()3<)2()10o1412IU8C42 U 

s»ites 期 s slsi 
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(«) 调整的持续期 



间陽 

图 5*13 在1990年11 月的酣 5 个交易日交易的 IBM 股票调整持续期的样本自相关 函数： 
( a ) 调整的 序列： ( b ) WACD (1,1) 模型的标准化新息 

其中 {&} 是一个独立同分布的随机变量序列，服从参数6 = 0.879(0.012) 的标准 
化的韦布尔分布，这里 0.012 为估计的标准差.方程 (5.43) 中估计的标准差分别为 
0.039, 0.010 和 （).018. 所有估计的比都大于4.2,说明估计在1%水平下是显著 
的.图 5-12 b 给出了心=的时间图，图 5-13 b 提供了心的样本 ACF . 心的 
Ljung - Box 统计量为 Q (10) = 4.96, Q (20) = 10.75. 显然，标准化的新息没有显著 
的序列相关性.事实上，平方序列{芎}的样本自相关性也很小，其 Q (10) = 6.20, 
Q (20) = 11.16, 进一步确认了标准化的新息之间缺少序列相依性.另外，参数为 
« = 0.879 的标准化的韦布尔分布的均值和标准差分别为 1.00 和 1.14, 这些数字也 
接近于 { f ,} 的样本均值 1.01 和标准差 1.22. 拟合的模型看上去是合适的. 

在模型 （5.43) 中，估计系数 M + u ； i « 0.949. 隐含了调辖持续期的某种持续性. 
调整持续期的期望为 0.169/(1-0.064-0.885)=3.31 这接近于调整持续期的样本 
均值 3.29. 标准化韦布尔分布的形状参数的估计 o 为 0.879, 小于1但是接近于 1. 
因此，条件危险率函数以缓慢的速率单调递减. 

如果对新息采用广义 gamma 分布函数，那么拟合的 GACD (1,1) 模型为 

Xi = ipi £ i , 啦= 0.141 4- 0.063 xi_i + 0.897 也 _1， (5.44) 

其中 {£, } 服从方程 （5.56) 的标准化的广义伽玛分办，参数 /c = 4.248(1.046) 且参数 
a 二 0.395(0.053), 括号内的数字表示估计的标准误差.方程 (5.44) 中三个参数的标 
准误差分别为0.041， 0.010 和 0.019. 所有的估计在1%水平卜都是统计上显著的. 
标准化的新息过程 {☆} 及其平方序列都没有显著的序列相关.这里纟，= Xi /^ i 是根 
据模型 (5.44) 定义的.具体 来讲. 对于 ☆ 过程.我们有 Q (10) = 4.95, Q {20) = 10.28; 
对 € 序列，我们有 Q {10) = 6.36, Q (20) = 10.89. 
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模型 (5.44) 的期望持续期是 3.52. 稍高于方程 （5.43) 中 WACD (1,1) 模型的持 
续期.类似地,模型 (5.44) 中的持续参数％ +仏也稍高于 0.96. 

注释： EACD 模型的估计可以利用一些带 minor 修改的 ARCH 模型的程序 
来 实现. 具体可参见 Engle 和 Russell (1998). 本书用作者创建的 RATS 程序或者 
一些 Fortran 程序来估计持续期 模型. 有限的经验表明估计一个 GACD 模型比估 
计一个 EACD 模型和 WACD 樓型都吏困难.用来估计 WACT ) 与 GACD 模型的 
RATS 程序在附录 C 中给出. □ 


5.6 非线性持续期模型 

高频数据中也通常会发现非线性性质.作为说明.我们在例 5.4 中，对 IBM 交 
易的持续期拟合的 WACD (1,1) 模型的标准化新息.利用笫4章中讨论的一些非线 
性检验，可参见方程 (5.43). 根据一个 AR (4) 模型，在表 5-7 中的 （ a ) 部分给出检 
验结果 • 正如从例 5 _ 4 的模型诊断中预期的， Ori-F 检验显示标准化新息中没有二 
次非线性性.然而， TAR-F 检验统计童却显示了很强的非线性性. 


表 5-7 对 IF » M 从1990年11月1日至1990年11月7日交易持续期的非线性检验 i 



a 只利用 TR 内持续期 TAR-F 检验括号内的数表示时问赶迟 . 


根据表 5-7 的检验结果，我们对 IBM 的日内持续期考虑一个两体制的门限持 
续期模型 (threshold duration model ). 门限变量为： rn (即一步延迟调整持渎期). 
门限值的估计为 3.79. 拟合的门限 WACD (1，1) 模型是而-其中 

[ 0.020 + 0.257心_1+0.847你_1，£：*~切(0.901),若 x { -i < 3.79, p 
1 1.808 + 0.027:^4+0.501 也 w (0.845)， 若 > 3.79, (5 ' 4<，) 

这里 «;(«) 表示参数为 a 的标准化韦布尔分布.两种体制下观测值的数量分别为 
2 5() 3 和 1 030. 在方程 （ 5. 4 5) 中，第一个体制中参数的标准误差分别为 （ ).043, 0.041, 
0.024 和 U.U14; 而第一个体制中参数的标准差分别为 0.526, 0.020, 0.147 和 0.020. 

考虑方程 (5.45) 表示的门限 WACD(1,1) 模型的标准化新息& = XiM. 得到 
白的 Q(12) = 9.8, Q(24) = 23.9; ef W Q(12) = 8.0, Q(24) = 16.7. 这样， A 序列与 
i ' i 序列之间均无显著的序列相 关性. 而且，对这个新的标准化新息序列 f ，， 应用前 













.7 价格变化和持续期的二元模型 


面同样的非线性检验，我们没有检验出非线性.结果见表 5-7( b ) 部分.因此，方程 
(5.45) 中的两体制 WACD (1，1) 模型是合适的. 

如果我们将两体制分为大童交易与很少交易两个时期，那么对 IBM 股票.门 
限模型显示，由日内交易持续期度量的交易动态性在大童交易与很少交易两个时期 
是不同的（即使在日内模式调整之后).这并不令人惊奇.因为市场活动经常是新的 
信息和其他信息的到达驱动的. 

方稈 (5.45) 估计出的门限 WACD ( l . l ) 模型包含一些不显著的参数.我们将模 
型提炼得到如下结果 

{ 0.225 xj_i +- 0.867 也 _ i ， e < 〜 w (0.902), 若 Xi -\ ^ 3.79, 

1.618 4- 0.614^,_ i,£t ~ w (0.846)， 若 Xi_i > 3.79. 

提炼岀的模型的参数估汁都是髙度显著的.标准化的新息 A = 的 L ~ B 统计 
量显示 Q(10) = 5.91(0.82). Q(20) = 16.04(0.71); 疗的 L-B 统计置显不 Q(10) = 
5.35(0.87), Q(20) = 15.2U(U 76), 这里括号内的数字是 p 值.因此，提炼出的模型是 
合适的.用来估计前述模型的 KATS 程序在附录 L’ 中给出. 

5.7 价格变化和持续期的二元模型 

本节引入一个考虑 f 价格变化和相应持续期的联合过程的模型.如前所述，许 
多股票的日内交易是无价格变化的、那些交易与交易强度高度相关，但它们不包含 
关于价格运动的直接信息.因此，为了简化价格变化建模中的复杂性，我们集中讨 
论导致价格变化的交易.并考虑同时描述价格变化和相应时间持续期的多元动态性 
的价格变化与持续期 （price change and duration , 简称为 PCD ) 模型 • 

继续利用 5.6 节中记号,但是定义改为价格变化的交易.令^是资产在第 i 次 
价格变化的日历时间.同前面一样，^是从一个交易日的午夜开始以秒为单位测量 
的.令巧，表示第 i 次价格发生变化时的交易价格.= U - U —' 是价格变化的 
时间持续期.另外 ，令况 表示时间间隔中无价格变化时的交易数量.这 
个新变量被用来表示无价格变化期间的交易强度最后，令 A 表示第 i 次价格变 
化的方向-当价格上升时，认=1;当价格下降时，= -1 .令况表示以最小价位 
变动单位测量的第；次变化的大小.在新的定义下.股票价格随时间的变化为 

Pt t = Pu- t + DiSi . (5.46) 

对第/ 次价格变化的夂易数据包括 PCD 模型关心的是对 (从爲 
A , 50的联合 分析. 

注释： 集中于与价格变化相联系的交易可以大大地降低样本的大小.例如.考 
虑 IBM 股票从1990年11月1日至1991年1月31日的日内數据，共有60 265 
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个日内交易，但是它们中只有 19 022 个引起了价格变化.另外，价格变化的时间持 
续期中没有日内模式. 口 

为了解释所有交易的价格运动与只跟价格变化相关的交易的价格运动之间的 
关系，我们考虑 IBM 股票在1990年11月21日的日内交易.在这一天的正常交易 
时间.有726个交易.只有195个交易引起了价格变化图 5-14 显示了两种情况下 
价格序列的时间阁.正如所预期的价格序列是相同的. 


( a ) 所有交妨 



图 5*14 IBM 股票在 1990 年 11 月 21 日的日内交易价格的时间阁： 

( a ) 所有交易： （ b ) 导致价格变化的交易 

在给定的条件下, PCD 模型将 ( AU . Ni . D ^ Si ) 的联合分布分解为 

= /(5i|A, N iy Ati, Fi-MDilNi, At if (5.47) 

这个分解使得我们能够对条件分布指定合适的经济计量模型，从而简化建模的任 
务. 有许多方式对条件分布指定模型，一个恰当的指定可能依赖于所研究的资产. 
这里我们采用 McCulloch 和 Tsay (2000) 使用的 指定. 他们对离散取值的变量采用 
广义的线性模型,对连续取值的变量 In ( A ^) 采用了一个时间序列模型. 

对价格变化之间的时间持续期.我们采用的模型为 

ln ( Ah ) = A ) + /3 1 ln ( A ^_!) -f / hSi - i + aei , (5.48) 

其中 a 是正数 • 是独立同分布，服从 N (0,1) 的随机变量序列.这是关于延迟变 

置的多元线性回归模型.如果有必要，可以在模型中加入其他的解释变量.为了确 
保时间持续期为止.我们利用/对数变换. 

Ni 的条件模型又被进一步分解为两部分.因为经验数据显示； V ，集中在0点. 






Ni 模型的第一部分为 logit 模型 
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p{Ni = 0|At <r Fi_i) = Logit[a 0 +ai ln(A<i)], 
其中 logt «( a :) = exp ( x)/[l + exp ( u ：)], 而模型的笫二部分为 
NiKNt > 0, At u F 卜 d 〜 1 + 5 (A0 ， A t 


(5.49) 


(5.50) 


exp[ 7 o -I- 7 i ln(A<Q] 

1 十 exp[7o + 7i In(At ,)] 1 

其中〜意思是“服从的分布为”， g (\) 表示参数为 A 的几何分布，即 A 在区间 （0,1) 
上取值. 

方向 A 的模型为 


OiKiVi, Ati, F t i) = s\gn(fMi + 0 "<£), (5.51) 

其中 £ 为服从 iV(0,1) 的随机变量，而且 

Hi = coo -f-wiDj-i -j- uj2 ln(Aij), 

4 

^(^*) = P Di-j = (3 1 A-i + A_2 + + Di-4\ . 

j=i 

换句话说， A 是由均值为叫、 方差为 < rf 的正态随机变量控制的.上述模型的特殊 
特征是函数对于日内交易，一个关键的性质是两个连续价格变化之间的价 
格逆转.这个性质是通过在均值方程中 D , 对 A _ i 的依赖允许^为负值来建模 
的.然而，价格运动中存在很少的局部趋势.当过去的数据呈现出局部趋势时，上 
述的方差方程通过增加价格运动方向的不确定性来允许这样的局部趋势存在于模 
型中.对于一个有固定均值的正态分布，增加方差使得一个随机移动有同样的机会 
取正值或负值.这又增加了序列仝部为正的移动与全部为负的移动的机会.这样一 
个序列就产生了价格运动的局部趋势. 

为了允许正负价格运动之间的不同动态性，我们对价格变化的人小釆用不同的 
模型.具体来讲，我们有 

5, i|(A = —~ p ( A d>< ) I 1, Ln ( A d ,») 

= 十 Vd,iNi + rjd ,2 ln(Ati) 4- rjd ， 3Si-u (5.52) 

沒 <1,(认 = 1， iV <， F {— i ) ~ p ( A «， i ) + 1， ln ( 入 u ,4) 

=»7u ， 0+»7u,2 !!!(△*<) +r ； u ,35<—l, (5.53) 

其中 p ( A ) 表示参数为 A 的泊松分布.在大小中加入 1 是因为当价格变化时最小的 
大小为1个最小价位变动单位. 
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方程 （5.48) 〜 (5.53) 中指定的模型可以通过最大似然方法或 MCMC 方法来联 
合估计.根据方程（5.47)，这些模型包含了 6个可以单独估计的条件模型. 

例 5 .5 考虑 IBM 股票在1990年11月21日的日交易.在正常的交易时间有194 
个价格变化.图 5*15 给出了 ！!!(△&)， 况， A 和况 的直方图 . D , 的数据在“上升” 
与“下降”运动中大约是平等分布的.只有极少数交易导致了大于1个价位变动申 
位的价格变化事实上，有7个具有2个价位变动单位的变化：有1个具有3个价 
位变动单位的 变化. 利用 MCMC 方法（详见第12章)，我们对数据得到下面的模 
型. 描述的估计及其标准差是9 500次迭代中 MCMC 抽取的后验均值和标准差. 
价格变化的时间持续期模型为 

ln ( A <<) = 4.023 + 0.032 ln ( At ,_ i ) - 0.025 况+ 1.403 e it 

其中系数的标准差分别为 0.415, 0.073, 0.384 和 0.073. 拟合的模型显示在时间持续 
期中没有动态相依性.别变量我们有 


Pr(Ni > n | Ai i } F f 0 = log it [-0.637 + 1.740 ln ( A < i )], 

其中估计的标准差分别为 0.238 和 0.248. 这样，在时间间隔上无价格变 
化的交易数量正向依赖于间隔的长度.当况 > 0时，其大小为 


Ar ,|( AT t >0, At t , F ,_0 - 1 + WA ,)， 


exp [0.178-0.910 ln ( A < Q 1 
1 + exp [0.178 - 0.910 ln ( Ati )]' 


其中估计的标准差分别为 0.246 和 0.138. ln ( A <,) 的显著的负系数意味着 AT , 与持 


续期 At 的长度是正相关的.因为大的 ln ( A /,) 预示着一个小的 A , ,从而隐含了恥 


以更高的概率取大的值可以参见方程 (5.27) 中的几何分布. 



太小以嬝小变动价位测 a 交易数 


图 5-15 IBM 股票在1990年11月21曰的日内交易数据的直方图： （ a ) 价格变化间的 
对数持 续期； （ h ) 价格变动的 方向； （ c ) 以最小变动价位测罱的价格变化的 大小; 
( d ) 无价格变化的交易个数 





对 D , 拟合的模型为 
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/( 咖 ）= 


m =0.049 - 0.8400^! - 0.004 ln ( Ati ), 

ln ( o - j ) = 0.244 |功 _1 十 Dj_2 + Z ? i — 3 + ^*-4| i 

其中均值方程中参数的标准差分别为 n.129, 0.132 和 0.082, 而方差方程中参数的标 
准差为 0.182. 价格逆转可以从 R 1 的高度显著的负系数中清楚地显示出来.方 
差方程的边际显著参数也正好是所期 望的. 最后，对价格变化大小的拟合模型为 

ln ( A dti ) = 1.024 — ().327况 + 0.412 ln ( Aii ) - 4.475<- i t 

ln ( A Uil ) = -3.683 - 1.542 M + 0.4191 n ( A ^) + 0.9215<_ i , 

其中“下降 大小” 参数的标准差分别为 3.350, 0.319, 0.599 和3.188,而“上升大小” 
的参数的标准差分別为 1.734, 0.97 G , 0.453 和 1.459. 上述两个方程令人感兴趣的地 
方是 M 的系数的估计值为负数.个大乂意味着在时间间隔 { U - U t t ) 屮有更多 
的交易没有价格变化，这可以看作是时间间隔中没有可以利用的新信息 
的 证据. 因此，^时刻价格变化的大小应该比较小.泊松分布中的小与精 
确地说明了这一点. 

总之，假定给定某天的194个观测值样本可能不包含关于 IBM 股票交易动 
态的充分信息，但是拟合的模型看上去提供了一些合理的结果. McCulloch 和 Tsay 
(2000) 把 PCD 模型扩展到一个分级结构框架，来处理从1990年11月1日至1991 
年1月31日之间的所有63个交易日的 数据. 有超过19 000个观测值，许多参数 
估计在这个扩展模型中都是显 著的. 例如，在时间持续期模型中，的系数 
的全部估计从 0.04 到 0.1 变化.尽管这种变化比较小但是很显著 • 

最后，利用交易数据来检验微观结构理论通常需要仔细地指定所用变量它也 
要求对市场运作的方式与数据收集有更深刻的 理解. 然而，本章中讨论的计量经济 
模型的思想很有用，并且它已在高频数据分析中得到广泛应用. 

附录 A —些概率分布的回顾 

指數分布 

称随机变量 X 服从参数为 0(0 ;> 0) 的指数分布，如果其概率密度函数 ( prob ¬ 
ability density function , 以下简记为 pdf ) 由下式给出 
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这样一个分布表示为 X 〜 exp ⑹.我们有 E ( X ) = 0, Var ( X ) = 0 2 . X 的累积分布 
函数 (Cumulative distribution fiinrtion , 以下简称为 cdf ) 为 





0 , 


若 a : < 0, 
若 x ^ 0. 


当卢=1时，称 X 服从标准指数分布 • 

伽玛函数 

对于 K > 0,伽玛函数 r («) 定义为 

r(/c) = f°° x k ~ l e~ x dx. 

JO 


伽玛函数最重要的性 质为： 

( 1 ) 对任意的《 > 1， r ⑷ = («- i ) r («- i )； 

(2) 对任何正整数值 m ， r ( m ) = ( m - l )!; 

⑶ r ④= 0F. 

■ 

r ( j /|/ c ) = x K ~ 1 e~ x dx 1 y > 0 
Jo 

是一个不完全的伽玛函数，它的值在文献中已用表列出.佔计不完全伽玛函数的计 
算机程序现在也是可以得到的. 


伽玛分布 

称随机变量 X 服从参数为 K . 和 /?(K >0,/9>0)的伽玛分布，如果其 pdf 由下 
式给出 

/ 1 若2?>0， 

若 


/( 水冷） 

通过变量代换 <J = x/0, 可以很容易得到久的各 阶矩: 


俨 r(«) 

0， 


< 0 . 


E (^ m ) = x m f{x\K,0)di 


1 r w 

rRJo 


/ 3 m 

rR . 


y K+m-l e - W{ly 


0 k T ( k ) 


x K ^ m ~ l e - x /Pdx 


r ⑷ 


特别地，久的均值、方差分别为 E(X) = Var ( X ) = Kffi. 当 0 = 1 时，该分办称 
为一个参数为 K 的标准伽玛分布.利用记号 G 〜 gamma («) 表示 G 服从一个参数 
为《的标准伽玛分布 . G 的各阶矩为 

r(« -f m) 一 

m>0 - 


E ( G m ) 


(5.54) 
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为 


韦布尔分布 

称一个随机变量X服从参数为 a .0( a > O y 0> O ) 的韦布尔分布.如果其 pdf 


/( 咖 ， /?) = 


P a 

0， 


若 a： 0, 
若 X < 0, 


这里/?和《分别为分布的尺度参数和形状参数 .A： 的均值、方差分别为 


EP0 續 «), Var OT = ^{r(l + |)-[r(l + I)] 2 J 


F{x\a,f3) 


A ■的 cdf 为 

若 a ? < 0, 
「(翁, 若： r >0. 

当 a = 1时，韦布尔分布简化为指数分布. 

定义 y = x /[/3 i，(i + $)]• 我们有 E ( K ) = 1,而且 y 的 pdf 为 


HvH 


[«)] 广 1 _{-[«>]•} 


若 y^O, 
若 y < 0, 


(5.55) 


这里由于标准化，所以尺度参数消失了.标准化的韦布尔分布的 cd f 为 

仍丨、 J 0 ， 若以 <0 ’ 

，和卜 - exp {-[ r 卜 yfl ， 若: v>0 ， 

并且我们有 E(y) = 1， Var(y) = r(l + J)/fr(H-/a)p-l. 对于带韦布尔分布新息 
的持续期模型，最大似然估计中利用的就是上述的 pdf. 

广义伽玛分布 

称随机变量 ； >(： 服从参数为 a，A K(a > 0,/3> 0, k > 0) 的广义伽玛分布如果 
它的 pdf 由下式给出 


/(x|a, /d, k ) 


p ko r(K) 
i). 


^j exp Ki) Q 


若 i 彡0, 
其他, 


其中是尺度参数， a ，K 为肜状 参数. 这个分布可以写为 

-(f)' 
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这里 G 是参数为 k 的标准伽玛随机变量 . X 的 pdf 可以通过变量代换的方法由 G 
得到.类似地， X 的矩可以从方程 （5.54) 中 G 的矩得到 

E(x m ) =聊 r ? 1/o ) m | = mc m,a ) = 严) = ri r ^ y —• 

当 《 = 1 时，广义伽玛分布简化为韦布尔分布.这样，指数分布和韦布尔分布 
都是广义伽玛分布的特殊情况. 

广义伽玛分布的期望为 E ( X ) = /3 r («4- i )/ r ( K ). 在持续期模型中，我们需要 
—个带申位期望的分布.因此，定义随机变量 Y = xx/fl, 这里 a = r ( K )/ r(K + 去)， 
则有 E ( K ) = 1， K 的 pdf 为 

/( l /| a , K )=( ex P h ( f )] ，若 w > 0， (5.56) 

1 0, 其他， 

这里 0 仍然是尺度参数， A 二 r ⑷ / r (« 十 J ). 

附录 B 危险率函数 

对持续期建模时一个有用的概念是由分布函数隐含的危险率 函数. 对随机变 
量； C , 生存函数定义为 

5( a ?) = P(X > a :) = 1 — P(X < rc ) = 1 — cdf (3 r ), x > f ), 

这给出了服从 X 分布的每个事物在时刻 < 生存的概率 • X 的危险率函数(或强度函 
数）定义为 

_ =爲 (557) 

其中 /(.) 和 5(.) 分别是 X 的 pdf 和生存函数. 

例 5.6 对于参数为 a 、 的韦布尔分布，生存函数与危险率函数分别为 

S(a;|a, 卢) = exp [― ( 吾)] ， h{x\a t p) = ^x a_1 , ® > 0. 

特别地，当 a = 1时，我们有 h ( x \0) = 1/(3. 因此，对于指数分布而言，其危险率函 
数是常数，对于韦布尔分布，危险率函数是单调的 • 如果 a > 1，那么危险率函数是 
单调递增的，如果 a < 1,那么危险率函数是单调递减的.对广义伽玛分布，生存函 
数以及危险率函数都涉及不完全伽玛函数然而危险率函数可以有各种不同的形 
状,包括 U 型以及倒 U 型.这样,广义伽玛分布提供了对股票交易的持续期建模的 
一个灵活方法. 
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对标准化的韦布尔分布，生存函数以及危险率函数为 
S(y\a) = exp |^r (l + ， 

/i(y|of) = or [r (1+1)] y a_l , y > 0 , 

附录 C 对持续期模型的一些 RATS 程序 

运用的数据是 IBM 股票从1990年11月1 H 至11月9日每日交易的调整后 
的时间持续期.文件名为 ibmlt 05. txt ， 共有3 534个观测. 

估计 WACD (1,1) 模型的程序 

all 0 3534:1 

open data ibmlto5.txt 
data(org=obs) / x rl 
eet psi = l.o 
nonlin aO al bl al 

frrol gvar = a0+al*x(t-l)+bl*psi(t-1) 

frml gma = %LNGAMMA(1.0+1.0/al) 

frml gin =al*yma(t)+log(al)-log(x(C)) $ 



估计 GACD (1,1) 模型的程序 

all 0 3534:1 

open data ibmlto5.txt 

data(urgsobB) / x rl 

set psi = 1.0 

nonlin aO al bl al ka 

frml cv = a0+al*x(t-l)+bl*psi(t-1) 

frml gma = %LNGAMMA (k.a) 

frml lam = exp(gma(t))/exp (%LNGAMMA(ka+(l .0/al))) 
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set fv =* cv(t) 

set resid - x(t)/fv(t) 

set residsq = resid(t)♦resid(t) 

cor(gstats,number=20,span=10) resid 

cor(qstats,number=20,span-10) residsq 

估计门限— WACD (1,1) 模型的程序 

指定的门限为 3.79 
all 0 3534:1 
open data ibmlto5.txt 
data(org=obs) / x rt 
set psi = 1.0 
nonlin al a2 al bO b2 bl 

frnd u = ( (x(t-l)-3.79)/abs(xa-l)-3.79>+l.0)/2.0 

frml cpl = al*x(t-1)+a2*psi(t-1) 

frml gmal = %LNGAMMA (1.0+1.0/al) 

frml cp2 = b0+b2*p3i(t-1) 

frml gma2 = %LNGAMMA (1.0+1.0/bl) 

frml cp = cpl(t)*(l-u(t))+cp2(t)*u(t) 

frml glnl =al*ginal (t)+log (al) log(x(t)) $ 

+al*log(x(t) / (psi(t)=cp(t))) - (exp(gmal (t) }*x(t)/psi(t))**al 
frml gln2 =bl*gma2(t)+log(bl)-log(x(t)) $ 

+bl*log(x(t) / (psi(t)=cp(t)))-(exp(gma 2 (t))*x(t)/psi(t))**bl 
frml gin - glnlu(t))igln2(t)*u(t) 
smpl 2 3534 

confute al = 0.2, a2 = 0.85, al = 0.9 

compute bO = 1.8, b2 = 0.5, bl = 0.8 

maximize(method-bhhh , recursive,iterations=150) gin 

set fv = cp(t) 

set resid = x(t)/fv(t) 

set residsq = resid(t)*resid(t) 

cor(qstats,number-20,epan^lO) resid 

cor(qstats,number=20,span=10) residsq 


练习题 

5.1 令 r t 为资产在 t 时刻的对数收 益率. 假定 { n } 是均值为0.05、方差为 1.5 的髙斯白噪 
声.还假定在每个时间点交易发生的概率为40%,并且交易是否发生弓 n 独立.用 r ? 表 
示观测到的收益率.问 | r ? 是序列相关的吗？如果回答是肯定的，请计算 r ? 的前3步延 
迟自相关系数. 

5.2 令朽 是观测到的资产的市场价格,它通过方程 （5.9) 与资产的基本价值/ V 相联系.假定 
AP ； = P； - Pe *_, 是一个均值为0、方差为 1.0 的高斯白噪声序列，并假定买卖报价差为 
2个最小变动价位 .问： 当最小变动价位是1/8美元时，价格变化序列 △朽 = Pt - Pt-x 
的一步延迟自相关系数是多少？当最小变动价位是1/16美元时，价格变化的一步延迟自 
相关系数是多少？ 

5.3 文件 ibm - d 2- dur . txt 包含了 IBM 股票1990年11月2日交易之间调整的持续期.这个 



练习题 217 


文件有3列，含有天、从午夜开始以秒测量的交易时刻以及调粮持续期. 

( a ) 对调整持续期建立一个 EACD 模型,并检验拟合的模型. 

( b ) 对调整持续期建立一个 WACD 模型，并检验拟合的模型. 

( c ) 对调整持续期建立一个 GACD 模型，并检验拟合的模型. 

( d ) 比较前面的3个持续期模型. 

5.4 文件_ 9 91 2 -批？1灯包含了3\1公司的股票在1999年12月的交易数据.有3 列：这 
个月的大、从午夜开始以秒测量的交易时刻、交易价格.排除了东部时间4:00以后发生的 
交易. 

( a ) 3 M 股票交易具有曰模式吗？你可以构造一个时间序列用它表示每5分钟时间间 
隔内的交易数量来回答这个问题. 

( b ) 利用价格序列来确认 3 M 股粟的曰内交易中买卖报价弹性的存在性. 

( c ) 以最小变动价位1/16美元的倍数将价格变化的频率列表.你可以将变化为最小交动 
价位的5倍或超过5倍的分成一类，变化为最小变动价位的 -5 倍或起出_5倍的 
作为另一类. 

5.5 再次考虑 3 M 股票在1999年12月的交易数据 

( a ) 利用此数据构造曰内每5分钟的对数收益率序列，利用毎5分钟间隔内所有交易价 
格的简单平均作为这个间隔的股票价格 •问： 此序列是序列相关的吗？你可以利用样 
本自相关函数的前10步延迟值的 Ljung - Box 统计量来检验这个假设. 

( b > 在正常的交易日共有77个每5分钟收益率.某些研究者建议可以用日内的每5分钟 
收益率的平方和作为日波动率的一个度量.采用这个方法，并计算 3 M 股票在1999 
年12月的对数收益率的日波 动率. 讨论用这样的方法来估计日波动率的有效性. 

5.6 文件_ 9 912- adur.txt 包含了 3 M 股票在1999年12月调整的日交易持续期.在一个 
夂易日内有39个每 1() 分钟的时间间隔. 令 di 为 1999年12月所有的交易日内第 i 个 
10分钟间隔的所有对数持续期的平均.定义调整的持续期为 G / eX p ( d ,)， 其中 j 是在第，: 
个10分钟间 隔内. 注意到更多的力法可以用米调整交易持续期的曰内模式.这里我们仅 
仅使用局部平均. 

( a ) 在调整的持续期序列中有日模式吗？为 什么？ 

( b ) 利用指数新息对调整的序列构造--个持续期模型并检验拟合的模型. 

( c ) 利用韦布尔分布对调整的序列构造一个持续期模型并检验拟合的模型. 

( d ) 利用广义伽玛分布调整的序列构造一个持续期模型并检验拟合的模型 • 

( e ) 比较并评论前面构造的3个持续期模型. 

5.7 为了得到分析高频金融数据的经验，考虑 GE 股票从 2 003年 I 2 月1日到12月5日的 
交易数据，该数据包含在文件 taq - t - ge - dec 5 .txt 中.文件有4大列 ：闩期 ，时间（小时， 
分钟，秒)，价格和交易量_忽略正常交易时间之外的交易（即东方时间上午9: 30到下午 
4: 00)，对于每隔5分钟交易的数量建立一个时间 序列. 在所构建的时间序列中有每日特征 
吗？为回答该问题,你可以简单计算序列的样本 ACF . 交易数量在文件 taq - ge - dec 5- nt . txt . 
5.8 冉次考虑 GE 股票从2003年12月1日到12月5日的交易数据，忽略正常交易时间 
之外的交易.构建 H 内每隔5分钟交易的收益率序列.注意到5分钟时间间隔（例如从 
9 : 30到 9 : 35) 的股票价格为该时间间隔内最后一次交易的 价格. 为简便.忽略隔夜收益 
率.每隔5分钟的收益率序列有序列相关性吗？用延迟为 KJ 的 ACF 和5%的显著性水 
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平进行 枪验. 参见文件 taq - ge - dec 5-5 m . txt . 

5.9 考虑习题 5.8 中同样的问题，但是用每10分钟间隔的数据.参见文件 taq - ge - dec 5- lom . 
txt 

5.10 再次考虑 GE 股票的髙频数据.忽略正常交易时间之外的交易.计算样本中两个连续交易 
没有价格变化的百分比. 


参考文献 

Box, G. E. P. and Cox, D. R. (1964). An analysis of transformations. Journal of Um Royal 
Statistical Society Serifs B 30; 211-243. 

Campbell，J.Y., Lo, A. W. ? and MacKinlay, A,C.(1997 )，The Rmnomeirics of Financial Market^ 
Princeton University Press: Princeton, NJ. 

Cho, D.，Russell, J,R” Tiao, G. C., and Tsay, R. S. (2003)，The magnet effect of price limits: 
Evidence from high frequency data on Taiwan stock exchange, Journal of Empirical Finance 
10: 133-168. 

Engle, R- P. and Russell, J. R.(lB98) t Autorogroeeivo conditional duration: a new model for irreg¬ 
ularly spaced traimaction data, Econometrica, 66: 1127-1162. 

Ghynels, E(2000). Some econometric recipes for high-frequency data cooking, Journal of Business 
and Economic Statistics 18: 154-163. 

Hasbrouck, 丄 (1992), Using the TORQ Database, Stern School of Business, New York University, 
New York. 

Hsasbrouck. J. (1999), The dynamics of discrete bid and ask quotes, Journal of Finance 54: 
2109-2142. 

Hauseman，J” Lo, A., and MacKinlay, C.(1992). An ordered probit analysis of transaction stock 
prices, Journal of Financial Economics 31: 319-379. 

Lo, A. and MacKinlay, A. C. (1990), Au tscunoruetric analysis of nonsynchronoua trading, Journal 
of Ecnnnm.p.trir.A 4R:1H1—212. 

McCulloch, R. E. and Tsay, R. S. (2000), Nonlinearity in high frequency data and hicraxchical 
models t Studies in Nonlinear Dynamics and Econometrics 5: 1-17. 

Roll, R. (1984). A simple implicit measure of the effective bid-ask spread in an efficient market. 
Jorunal of Finance 39: 1127-1140. 

Rydberg, T. H” and Shephard y N.(2(X)3), Dynamics of trade-by-trade price movements: Decompo¬ 
sition and models, Journal of Financial Econometrics 1: 2-25. 

Stoll, H. and Whaley, R. (1990)，Stock market structure and volatility, Review of Financial Studies 
3: 37-71. 

Wood，R. A. (2000), Market microstnicture research databases:History and projections, Journal of 
Suaine 抑 & Economic Statiatics^lS: 140 145. 

Zhang, M. Y., Russell, J. R. t and Tsay ， FI. S.(2001a), A nonlinear autoregresHive conditional 
duration model with applications to financial transaction data. Journal of Econometrics 104: 
179-207. 

Zhang, M. Y., RusseLl, J. R., and Tsay, R. S. (2001b)，Determinants of bid aud a»k qautisi ami 
implications for the cost of trading, Working paper. Graduate School of Business, University 

of ChicaRo. 





第 6 章连续时间模型及其应用 

金融资产的价格随时间变化，形成一 个随机 过程. 随机过程是用来描述一个随 
机变置随时间变化的统计 术语. 观测到的价格是随机过程的一个实现.随机过程的 
理论是对观测到的价格进行分析和作出统计推断的基础. 

有两种随机过程模型可用来对资产价格 建模. 第一种称为 离散时间随机 过程， 
其中价格变化发生在 离散的 时间点上.前面章节讨论的过程都属干此类型.例如， 
纽约证券交易所 IBM 股票的曰收盘价就组成了一个离散时间的随机过程.这里价 
格只在一个交易日的收盘时刻发生 变化. 一个交易日内的价格运动不一定与观测 
到的日价格 有关. 第二种炎型 是连续时间的随机过 程，尽管价格只在 离散时 间点上 
可以观测到，但价格变化是连续的.可以将价格认为是股票的“真实价值”.它总是 
存在而且是时变的. 

对两种类型的随机过程.价格 N 以是连续的或者离 散的. 一个连续的价格可以 
假定为任何正实数，而一个离散价格只能假定为其可能取值构成的一个可数集合. 
假定资产价格是一个连续时间的随机过程.如果价格是一个连续的随机变量，那么 
就有一个连续时间的连续 过程. 如果价格本身是离散的，那么我们有一个连续时间 
的离散过程.对于离散时间过程也可以有类似的分类.第5章中的价格变化序列是 
离散时间的离散过程的一个例子. 

本章将资产价格看作是一个连续时间的连续随机过程.我们的目的是引入对 
金融资产和价格运动建模需要的统计理论和工具 • 本章的开始将介绍本章中使用 
的一些股票期权的技术•在 G .2 节，我们对布朗运动 (Brownmn motion ) (也称为维 
纳过程 (Wiener process )) 作一个简要的 介绍. 然后我们讨论了一些扩散方程以及 
随机方程，包括著名的伊藤引理 （Ito lemma ). 大多数期权定价公式是在资产价格 
服从一个扩散方程^假设下推导出来的.我们利用 Black - Scholes 公式（以下简称 
为 B - S 公式）来表示这种 推导. 最后，为了处理稀有事件（比如一个利润警告）引起 
的价格变化，我们也研究了一些简单的带跳跃的扩散模型. 

如果资产价格服从一个扩散方程，那么附随于资产的期权价格可以利用对冲 
(hedging) 方法推导出来.然而.有跳跃的时候，市场将变得不完全从而不存在完全 
的期权 对冲. 此时期权的价格或者利用跳跃风险的分散性来估价，或者定义一个风 
险的度量，然后选择一个价格和对冲来最小化这个 风险. 对于随机过程在衍生产品 
定价过程中的基本应用，参见 Cox 和 Rubinsteiu( 1985) 以及 Hull (2002). 
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6.1 期 权 

股票期权是一个金融契约.它赋予持有者在特定的円期、以一个指定的价格 
交易一个指定 的普通 股票特定份额的权利 • 它有两种类型 • 看涨期权 赋予持有者买 
某种标的资产的权利，其正式的定义见第 3 章. 看跌期 权赋予持有者卖某种标的资 
产的权利.契约中指定的价格称为敲 定价格或执行 价格. 契约规定的日期称 为到期 
a 或截至 Ei . 美式期权可 以在到期日之前的任何时刻执行， 欧式期权 只能在到期曰 
执行. 

股票期权的价值依赖于标的资产的价值•令表示敲定价格 ，尸 是股价.看涨 
期权当 P > K 时， 赚钱； 当 P = A ： 时， 不赔不赚；当尸< A '时， 赔钱. 看跌期权当 
P < A ： 时. 赚钱； 当 P K 时，不赔不赚：当 P K 时，赔钱.一般而言，一个期权 
如果立即执行将对持有者导致正的现金流时则是赚 钱的. 期权如采立即执行将刘 
股票持有者导致负现金流时则是赔钱的.最后，期权如果立即执行将导致0现金流 
时是不赔不 赚的. 显然，只有赚钱的期权在实际中才会被执行.要得到更多关于期 
权的信息，参见 Hull (2002). 

6.2 —些连续时间的随机过程 

在数理统计中，连续时间的连续随机过程定义在一个概率空间 （ acp ) 上，其 
中 n 是非空空间， F 是一个包含 n 的所有子集的域， P 是概率 测度. 具体可 
参见 Billingsley (1986) 的第1章.过程可以写为 M ^)}， 其中《表示时间并且在 
[0, oo ) 上连续.对于给定的/, x ( V ， t ) 是一个实值连续随机变量（即从 Q 到实直线上 
的一个映射)， t / 是 U 的元素.对于资产在时刻 f 的价格,的取值范围是非负 
实数集.对于一个给 定的％ {®( r /, t )} 是一个时间序列，其值依赖于时刻为了简 
便，我们将连续时间随机过程写为可以将其理解为，对于给定的^是一个 
随机变量.在文献中，一些作者为了强调 < 是连续的，运用来代替〜然而我 
们利用相同的记号: c t ， 但是称 它为个 连续时间随机过程. 

6.2.1 维 纳过程 

在离散时间经济计量模型中，我们假定“抖动”形成一个白噪声过程 (White 
noise process), 它是不可预测的.连续时间模型中“抖动”的对应部分是什么_?答 
案是一个維 纳过程 (也 称为标准布朗运动） 的增量有很多方式定义一个维纳过程 
{ w t }. 我们利用与在时间上的小增量相关的小变化 Awt = ^ t + A < 一忉 t 的一个 
简单 方法. 一 个连续时间随机过程是一个维纳过程，如果它满足 ： 

(1) 厶叫 = tVAf , 其中 e 是一个标准正态随机 变童； 

(2) 与叫独立，对于所有的 j 彡 
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笫二个条件是个马尔可夫性.说明在当前值叫的条件下，该过程过去的任何新 
息 Wj(J < t ) 与将米值 w t+ i{l > 0) 是不相关的 • 由这个性质很容易看出，对任意 
两个不相交的时间段△^与知增量 ~ w u 与增量 w t 2 ^- w t 2 是独立的. 
在金融屮，这个马尔科夫性与弱式有效市场是相关的. 

由第一个条件 ，△叫 是均值为0、方差为△纟的正态分布.也就是说， 么叫 〜 
AT (0， A 0. 这里〜表示概率分布.下面考虑过程叫.我们假定过程开始于 t = 0, 初 
始值为 叫， 这个值是固定的，而且通常设定为 0 •从而 w t -w 0 可以看作是许多微 
小增量的和.更具体地讲,定义 r = 忐，这里 △< 为一个很小的正增量，则 

T T 

w t — wq = w T At - wp = Awi = ^2 v/A<, 

t=l i=l 

其中 Wi^t - 因为诸 £ i 是独立的，所以我们有 


E(wt - wq) = 0, Var ( w t - w 0 ) = ^ At = TAt — t. 

i=l 

这样,叫从 0 时刻到 < 时刻的增量是均值为0、 方差为 t 的正态分布.规范地表示 
为，对于维纳过程 叫， 我们有 叫 - 吻〜 N(0,t). 这说明一个维纳过程的方差随带 
有时间区间长度的线性性质而增加. 

图 6-1 给出的是单位时间区间[0, 1] 上4个模拟的维纳过程.它们由在统计学 
文献中的 Donsker 定理的一个简单形式（参见 Donskcr (1951) 或 Bilingsley (1968)) 
得到.取 n =3 000. 这四幅图都开始于啡= 0,但是当时间递增时漂移分开.说明维 
纳过程的方差随时间 递增. 可以用一个从 [0,1] 到 [0, oo ] 的一个简单的时间变换来 
得到《 € [0, oo ] 上模拟的维纳过程. 



图4个模拟的维纳过程 








222 第 6 幸连续时间模型及其应用 


Dousker 定理 

假定 { zi }^ 是一个相互独立的标准正态随机变量的序列.对十任意《 e [ o ， i |, 
令 M 表示 W 的整数部分.定义 U；„. t =夫则当 n 趋于无穷时，依分 
布收敛到一个在 [0,1] 区间上的维纳过程购/ _1 
产生维纳过程的 S-Plu« 命令 


n = 300 

epsi = rnormCn, 0,1) 

w = cumsum (epsi)/sqrt(n) 

plot (w, type= 1 1 *) 

注释 1: 概率空间 （ aF , P ) 上的一个布朗运动叫的正式定义为：对于00, 
它是一个具有独立平稳增量的实值连续随机过程.换句话说，斯满足 

(1) 连续性：从《到叫的映射关于概率测度 P 几乎处处连续： 

(2) 独立 增量： 如果< f , 则对于所有的 v 彡 s , 叫-叫 与 w v 独立； 

(3) 平稳 增量： 如果 .s d ] w •，与 w t -B - m 具有同样的概率分布- 

可以说 明增黃 wt - 的概率分布是均值为 Mt — s )、 方差为 < r 2 ( t - s ) 的正态分布. 
而且，对于任意给定的时间指标0 < h < ... < 随 机向量 , W tk ) 

服从一个多元正态分布. 最后. 如果祕 0 = 0几乎处处成立 ， /i = 0且 （ T 2 = 1， Bi | 布 
朗运动是标准的. □ 

注释2:布朗运动的一个重要性质是它们的路径几乎处处不 可微. 换句话说, 
对一个标准布朗运动叫，对于卩中除了满足 P ( fii ) = 0的子集合 f 2 i C 以外的 
所有元素 都 是不存 在的. 因此，当考虑资产的时间价值时.我们不能运用通 
常的积分求和来处理涉及一个标准布朗运动的积分，必须寻求另外一种方法.这就 
是下一节中讨论 伊籐 积分的目的. 口 


6.2.2 广义维纳过程 

维纳过程是-个特殊的随机 过程： 具有0漂移率以及有与时间间隔的长度成 
比例的方差.这意味着期望的变化率为0而方差的交化率为 1. 在实践中，随机过 
程的均值和方差可以以一种更加复杂的方式随时间演变，因此需要随机过程的进一 
步一般化.为了这个目的，我们考虑期望漂移率为 M , 方差变化率为/的广 义维纳 
过程. 将这个过程用而来表示，并且用记号 dy 表示变里 y 的一个微小变化，则々 
的模型为 

dxt = fxdt + adwt, (6.1) 

其中叫是一个维纳过程.如果我们考虎方程 （6.1) 的离散形式，那么对于从0到 * 
的增量为 


x t — xq — fit aeVt. 






6.3 伊藤引理 223 


因此, 

E(a；i — a; 0 ) = Var(a?i — a?o) = c^t. 

结采 说明而 的增童对期望的增长率为 //， 对力差的增长率为 在文 献屮，力程 
(6.1) 中的 /X 与 a 称为 广义维 纳过程 而 的漂移参数和波动率参数. 


6.2.3 伊藤过程 

广义维纳过程的漂移参数和波动宰参数都不随时间变化.如果进一步扩展模 
型，允许//和 a 是随机过程: r t 的函数，那么我们就有了一个伊藤过程.具体来讲, 
过程 A 是一个伊藤过程，如果它满足 

dx t = / x ( zt , t)dt 4- tr ( x t , t ) dwt , (6.2) 

其中叫是一个维纳过程.这个过程在数理金融中起着很重要的作用，可以写为 

a ? t = a ： o + f n { x B , s ) ds -\- f 
Jo Jo 

其中邱表示过程在 0 时刻的初始值，右面的最后一项是一个随机积分.方程 (6.2) 
称为一个随机扩散方程，和 a { x u t ) 分别是漂移函数和扩散函数. 

维纳过程是一个特殊的伊藤过程，因为它满足方程 (6.2) 中取= 0且 
< r ( x t , t ) = 1 的情形 • 


6.3 伊藤引理 

金融中利用连续时间模型时,通常假定资产的价格是一个伊藤过程.因此，为 
了导出金融衍生资产的价格，需要利用伊藤积分.本节主要回顾一下伊藤引理，并 
将它看作是微积分中微分运算的自然推广.伊藤引理是随机积分的基础. 


6.3.1 微分回顾 

令 G(x) 表示 z 的可微函数.利用泰勒展开，我们有 

AG = G( 3 ： -hAx)-G( a ：) = ^(Ax) 2 + ^(Ax) 3 + 

当 △: r 一 0 时取极限，并且忽略 Ax 的高阶项，我们有 

… dG 




dx . 


当 G 为 a : 和 y 的函数时，我们有 


dG ^ , dG 〜 ,1 护、 2 ，护 G A A 1 护 、 2 

AG= di Ax+ dH Ay+ 2d^ {Ax) + d^, Ax ^^2W {Ay) + 
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当 Ax — 0且 Aj / — 0时取极限，我们有 


dG, ^ 0G. 
dG = d^ Ax + ^ dy - 


6.3.2 随机微分 


下面转到考虑 G ? 为和 t 的可微函数的情况， 其中: r t 是一个伊藤过程.泰 
勒展开变为 


dG 、 dG “ id 2 G,m 
AG= ^_ Ax+ _ Af+ __ (Ax) 


dx 


d 2 G ^ A+ ld 2 G 
d^ AxAt + 2^ {At) 


(6.3) 


伊藤过程的离散形式为 

△x = /iAt -|- aes / At , (6.4) 

这里为了简便，我们省略了 //和 c 的变元，并记 △: r = : r t + At — 由方程 （6.4), 我 
们有 

(Aa:) 2 = fi 2 {At) 2 + a 2 £ 2 At + 2/icr£ ： (At) 3/2 = or 2 e 2 At 4- (6.5) 

其中 //(AO 表示 △/ 的高阶项.这个结果说明 （ A ： r ) 2 包含了与同阶的项，当我 
们对 A<-*0 取极限时，此项不能忽略.然而，方程 (6.5) 右面的第一项有一些好的 
性质： 


= / t 2 AA , 

Var(aVA0 = E[aV (厶 i) 2 ] - [E(a 2 e 2 A0] 2 = 2a*(Atf, 

其中对于标准正态随机变量，我们利用了 E ( d ) = 3. 这两个性质说明了 a 2 c 2 At ^ 
A ^ O 时收敛到一个非随机量 a 2 ^. 因此，由方程（6.5)，我们有当 △< — 【)时， 

(Aar ) 2 —* <x 2 dt. 


将此结果代入方程 （6.3) 中，并且利用方程 （6.2) 中; r t 的伊藤方程,我们得到 


dG 


dG 
石 1 

fdo 


dG 

~di 


ld 2 G 

2 dx ^ 


dG 1 df^G 2 \ DG t 
+ ~ m ^2 d^ a ) dt ^ d^ adWt 


这就是随机微积分中著名的伊藤引理. 

注意我们在伊藤引理的推导中将变量 ( x t , t ) 从漂移系数 p 及波动率系数 rr 中 
省略了.为了避免将来有任何的疑惑，我们将引理重述如下. 
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伊藤引理 

假定 x t 是一个连续时间的随机过程，满足 


dxe = t)dt 4- <r(x tl t)duj t , 


其中叫是一个维纳过程.另外， G ( x t ,<) 是〜和*的可微函数.那么 

dG= + 菩+ | 祭 。 ，”] df + 尝咖’一卜（ 6 . 6 ) 

例 6 .1 作为一个简单的解释，考虑维纳过程的平方函数 G { uj t , t )= ul 这里我们 
有 / x ( tOt , t ) = O t cr ( a ； t , t ) = 1, 而且 


dG 

duji 


= 2a; t , 


dG 



因此， 

dwf = (2uJt xO 十 0 十金 x 2 x l)dt + 2cj t duj t = dt + 2u t du; t . 

6.3.3 —个应用 


(6-7) 


令 P t 表示一只股票在时刻 4 的价格，它在 [0, oo ) 上连续.文献中通常假定巧 
服从…个特殊的伊藤过程 


d P * = fiP t dt + erPtdu ) t , (6.8) 

其中 p 与 a 都是固定的.利用方程 （ 6.2) 中一般伊藤过程的记号，我们有 ^ x t , t ) = 
㈣ , ( r ( x t , t ) = ax t , 这里 x t = P t . 这样一个特殊的过程称为 几何布朗运动 （ Geo¬ 
metric Brownian Motion). 现在我们利用伊藤引理来得到针对股价只的对数的一 
个连续时间模型•令 G ( P t , t ) = ln(P0 表示标的股票的对数价格，则我们有 

dG _ 1 dG — n 1 d 2 G 1 (-1) 
m = Pt' aT = 0, 2dPf = 2~Pf' 

因此.根据伊藤引理，我们得到 

d Ln(_P t ) = (^—nP t 4- + —aPtdu t = ^ - dt H- adujt. 

这个结果说明如果价格是一个几何布朗运动，那么价格的对数服从一个一般的维纳 
过程,其漂移率为 Ai -< r 2 /2, 方差率为 a 2 . 因此，价格的对数（即对数收益率）从当 
前时刻 f 到将来某时刻 r 的变化服从均值为 （/! - W /2 )(r - t ) 、方差为 a 2 ( T - t ) 
的正态 分布. 若时间间隔 = △是固定的，而且我们更感兴趣于对数价格的等 
间隔的增量,那么增量序列就是一个均值为 (/ i - a 2 /2) A , 方差为 a 2 A 的高斯过程. 
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6.3.4 / X 和 <7的估计 

方程 (6.8) 的几何布朗运动中的两个未知参数 (X H a 可以用经验方法来估 
计.假定我们有股价 P t 在时间间隔△(例如日、周或者月）上的 n 4 1个观测值， 
可用年来度量 A . 观测到的价格表示为 - , Pn }, 并且对 * = 1. . .， n , 令 
U = bi ( P t ) - ln ( P t _ i ). 

因为尸 t = P t _ ie xp ( ri ), 其中^是第 i 个时间间隔上的连续复合收益率.利用 
前一小节中的结果，并且假定股价 A 服从一个几何布朗运动，我们得到 n 服从均 
值为方差为的正态分布.另外， n 不是序列相关的. 

为了简便，定义 //r = E ( r t ) = (/x - < t 2 /2) A , 0-2 = Var ( r t ) = cr 2 △.令 f , s r 分别 
表示数据的样本均值和标准差，即 


正如第1章中提到的， f •与〜分别是^的均值和标准差的相合估计，即当 n — oo 
时 ， f — 汾且 . 9r u r . 因此，我们可以通过 

匆 r 

估计 I 另外，可以表明该估计值的标准差渐近于 bl 孤. 由^ = f ， 我们可以通 
过下式来估计 /Z 

卜 

当序列 n 是序列相关的,或者当资产价格小服从方程 (6.8) 中的几何布朗运动 
时，则必须运用其他的估计方法来估计扩散方程的漂移参数和波动率参数.稍后我 
们再讨论这个问题. 

例 G .2 考虑1998年 IBM 股票的日对数收益率.图 6-2 a 是数据的时间图，共有 
252个观测值.图 6-2 b 描述了序列的样本自相关.可以看出，对数收益率确实是前 
后不相关的 . 统计量 （ Ljung - I 3 ox statistic ) 给出了 Q (10) = 4.9, 与自由度为 1() 
的 X 2 分布比较是高度不显著的. 

如果我们假定 1998 年 IBM 股票的价格服从方程 (6.8) 中的几何布朗运动，那 
么我们可以利用日对数收益率来估计参数和 a. 由数据我们有 F = 0.002 276, 
•s r = O.nifl 15. 因为一个交易日等价干 △ = 1/252 年，我们得到 

— -2 

a = ^ = 0.304 0, A = ^ + y = 0.619 8. 

因此在1998年， IBM 股票每年的期望收益率的估计为61.98%、标准差为30.4%. 
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m 6-2 1998年 IBM 股票的日收益率： （ a ) 对数收 益率； （ b ) 样本自相关性 


然而，日对数收益率的正态性假定可能并不成立.在这个特殊的例子中，偏度 
-0.464(0.153) 和超额峰度 2.396(0.306) 增加了某种关注，这里括号内的数字表示渐 
近标准误差. 

例 6.3 考虑1999年 Cisco Systems 股票的日对数收益率，共有252个观测值，样 
本均值和标准差分别为 0.003 32和 0.0263 03. 对数收益率序列也表明没有序列相 
关性, Q (12)=10.8 甚至在10%水平下都是不显著的.所以，我们有 


Sr 

7K 


0.026 303 
V ^ l .0/252.0 


0.418, (l 


K + T = 0 - 924 - 


因此， lyyy 年 Cisco Systems 股票的年期望收益率的估计为92.4%，标准差的估计 
为41.8%. 


6.4 股票价格与对数收益率的分布 


6.3 节的结果显示，如果假定一只股票的价格服从几何布朗运动 


dP t = f.tP t At + aP t du) t ^ 


那么价格的对数服从一般的维纳过程 

dln(Pt) = ^ - 替 ) erduJt, 

其中为股票在 t 时刻的价格 . u ； t 是一个维纳过程.因此，对数价格从时刻 < 到 
时刻 T 的变化是正态分布的，即 

ln(^V) 一 In ⑹〜 AT [ (// - 夸 )(T - *) ， tr 2 (r - 0] • (6.9) 
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因此,在给定时刻 * 的价格 p , 的条件下 ， r >«时刻的对数价格是正态分布的，即 

ln ( i ¥) - N [ ln ( Pe ) + ~ y ) ( T - t )^ 2 ( T -/)] • (6.10) 

利用笫1章中讨论的对数正态分布的结果，我们得到 Pt '的（条件）均值和方差分 
别为 

E ( Pr ) = P , exp [^( T -<)], 

Vax(Pr) — Pf exp [2/ u(T - i )]{ exp [ cr 2 (r - 4)] — 1}. 

注意这个期望确认了 / x 是股票的期望收益率. 

股价的先验分布可以用来作统计推断.例如，假定股票>1的当前价格为50美 
元,股票的年期望收益率为15%,年波动率为40%,则股票 A 在6个月 （0.5 年）内 
的期望价格和相应的方差由下式给出 

E ( P r ) = 50 exp (0.15 x 0.5) = 53.89, 

Var ( Pr ) = 2500 exp (0.3 x 0.5)[ expf 0.16 x 0.5] - 1] = 241.92. 

从现在幵始的 ti 个月内价格的标准差为 7241.92 = 15.55. 

下面，令 r 表示从时刻《到时刻 r 中每年的连续复合收益率，则我们有 

Pr = Pt exp [ r ( T -1)], 

其中 r 和 （ 是以年度量的.因此 

由方程（6.9)，我们有 

In (脊) 〜 〆 [("_ ^~) (了 - *) ， ( T -叫. 

因此,每年的连续复合收益率的分布为 



所以，连续复合收益率服从均值为 //- (7 2 /2,标准差为 a / VT ^ l . 的正态分布. 

考虑年期望收益率为15%,年波动率为10%的一支股票.该股票在两年内的连 
续复合收益率的分布是正态的，每年的均值为 0.15-0.1)1/2=0.145 或14.5%,标准 
差为 0.1/ v /5 = 0.071 或7.1%.这些结果允许我们对 r 构造置信区间 (confidence 
interval , 以下简记为 C . I .). 例如， r 的每年一个95%的 CU .为 0.145±1.96 x 0.071 ( 即 
0.6%, 28.4%). 
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6.5 B - S 微分方程的推导 


本节利用伊藤引理和无套利假定，对于价 值为朽 的股票的衍生未定权益的价 
格推导其 B ~ S 微分方程.假定价格尸,服从方程 (6.8) 中的几何布朗运动，并且 
G t = G ( P t ，0 是关于巧的衍生未定权益（例如一个看涨期权）的价格.由伊藤引 
理，得 


( dG t „ dG t 1 d 2 G t o , 
dGl - {dP^ P ^^f + 2d4^) dt 

这个过程以及前面结果的离散化形式为 


dG t 

dPt 


crP t dwt . 


AP t = fiP t At-\-aPt^w t , (6.11) 

AGt= (叢 。Pt + ^ +1 錄叫 △* + ^ PtAwu (6 . 12) 

其中 AP tl AG t 分别为 P t 和 G t 在一个小时间区间 At 上的变化.因为对于方程 
(6.11) 和 (6.12) 都有 …孤 所以可以构造不涉及维纳过程的股票与衍生资 
产的个组合.恰当的组合策略是卖空衍生资产并多头持有^的股份，用表 
示组合的价值.由构造，可知 

Vt= ~ Gt + ^ Pt , ( 6 . 13 ) 

则的变化为 

AV t = - AG t + 盖 AH . (6.14) 

将方程 (6.11) 和 (6.12) 代入方程 (6.14), 我们有 

AVt =(-^-1 語叫 M . ( 6 . 15 ) 

此方程并不涉及随机部分 A 叫. 因此，在无套利假设下，组合 K 在一个小时间区 
间上一定是无风 险的. 换句话说，所用的假设蕴涵组合一定同时可以赚得与其 
他的短期无风险证券相同的 收益； 否则，在这个资产组合与短期无风险证券之间就 
存在套利机会.因此，我们有 


AV * = rV t At = ( rAt ) Vt , (6.16) 

其中 r 为无风险利率.由方程 （6.13) 到方程 (6.16), 我们有 

(警 + ) At = r { Gt ~^ Pt ) At 
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所以 



这就是对衍生资产定价的 & S 微分方程.可以通过解此方程来得到标的变 量为八 
的衍生资产的价格. 

这样得到的解依赖于衍生资产的边界条件.对一个欧式看涨期权而言，边界条 

件为 

Gt = max(Pr — K, 0), 

其中 r 是到期时间，欠是执行价格.对于一个欧式看跌期权而言，边界条件变为 
Gt = max{K — Pr, 0 ). 

例 6.4 作为一个简单例子，考虑股票的一个远期合约，不支付红利.在这种情况 
卜，合约的价值由卜式给出 


G t = P t ^exp[-r(T- 0 ], 

其中 K 是交割价格 （delivery price ), r 是无风险利率, T 为到期日.对于这样的一 
个函数，我们有 


尝 = -tK exp [- r(r - t )], 
将这些量代入方程 (6.17) 的左面得到 


dG t 

dPt 


d 2 G t 

dP^ 


一 rK exp[—r(T — t)] -f rP t = r{P t K cxp[ r(T <)]}, 
等于方程 （6.17) 的右面.因此这的确满足 B - S 微分方程. 


6.6 B - S 定价公式 


Black 和 Scholes (1973) 成功地求解了方程 (6.17) 中的微分方程，并得到了对 
欧式看涨期权与看跌期权价格的精确公式.下面我们利用金融中所谓的风险中性 
定价来推导这些公式. 

6.6.1 风险中性世界 

将漂移参数 P 从 B ~ S 微分方程中去掉、在金融中这意味着此方程是与风险偏 
好独立的.换句话说，风险偏好不能影响这个方程的解.此性质的一个完美结果就 
是能够假设投资者是风险中性的.在一个风险中性世界里，我们有如下 结论： 

• 所有证券的期望收益率都是无风险利率 r ; 

•任何现金流的当前价值可以通过将它的期望价值以无风险利率折现得到. 




6.6.2 公式 
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在风险中性世界里 ， 一个欧式看涨期权在到期日的期望价值为 
E ^ maxCPr -^ O )], 

其中 E _ 表示在无风险世界中的期望价值.看涨期权在 f 时刻的价格为 

ct = exp [- r(T - t )] E *[ max ( P r - iC ,0)]. (6.18) 

然而，在风险中性世界里，我们有 p = r ， 并且由方程 (6.10), ln ( P r ) 是正态分 布的： 

]n(Pr) ~ N [in ⑹ + ( r 一 誓 ) (r - t),a 2 (T-t)j . 

令 g ( P T ) 表示 P T 的概率密度函数，则方程 (6.18) 中看涨期权的价格为 

c* = exp[-r(T-i)]JJ(/V- K)g{Pr)dPr. 

通过积分的变童变换以及一些代数计算（附录 A 中给出详细推导)，我们有 

c t = P t ^{ h + ) - Kexp [- r { T - t )}^{ h -), (6.19) 

其中 ^( x ) 是标准正态随机变量的积累分布函数在 x 点的值， 

, IniPtm-hir + c ^^ XT - t ) 

+ ’ 

G y/T 一 t 

实际中， $( x ) 可以很容易地通过大多数统计软件包 得到. 另外一种可供选择的方 
法，可以运用附录 R 中给出的一个近似. 

方程 （6.19) 中的 B _ S 看涨期权公式有一些好的解释.首先，如果在到期日执 
行期权，得到了股票，但我们必须要支付敲定价格.这个交换只有当期权是赚钱的 
(即 Pr > K ) 时才会发生.当且仅当丹> K 时，第一项 P t ^ h + ) 是得到股栗的 
当前 价值； 当且仅当 Pt > K 1 H , 第二项 - KexphrF - dW / O 是支付执行价格 
的当前 价值. 第二个解释尤其有用.正如 6.5 节中 B ~ S 微分方程的推导中显示的， 
^ (/1+) = ^是资产组合中不涉及不确定性和维纳过程的股份的数量.这个童就 
是套期保值 i 易中众所周知的 △. 我们知道 Ct = PMh ^)^ B t , 其中 a 为投资于 
资产组合（或衍生资产空头头寸）中的无风险债券的美元总量.可见从对 B - S 公式 
的检査中可以直接看出 B t = - Kexp \- r ( T - t )}^>( h .). 公式的第一项 $(/»+) 为 
投资在股票上的总量，而第二项 Kexp [- r ( T - i )]0(/ i _) 是借入的总量. 
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类似地,我们得到一个欧式看跌期权的价格为 


Pt = KeKp [- r ( T - t )]^(- h -)- PM - h + ). (6.20) 

因为标准正态分布是关于它的均值 0.0 对称的，所以我 们有： 对任何 ： c , $( x ) = 
1 - 利用这个性质,我们有 ^(-^) = 1 - ^{ hi ). 这样，计算一个看跌期权价 

格需要的信息与计算看涨期权价格所需要的信息是相同的.另外一个方法.利用正 
态分布的对称性，很容易证明 

p t -ct = K exp [- r(T - t )\ - P t , 

称 之为涨跌平价 公式，而且可用来从中得到 Pt .涨跌平价公式也可以通过考 
虑下面两个组合来得到. 

(1) 组合 A : —个欧式看涨期权加 / rexp [- r ( r -£)] 的现金. 

(2) 组合 B : —个欧式看跌期权加一股标的股票. 

到期权的到期日这两个组合的盈利为 


max(P/ t K). 


由于期权在到期日才能执行.组合必须与现价具有相等的价值.这意味着 
Ci-Y K exp [- r(T - 1)] = p t -\- P t , 

这正是前面所给出的涨跌平价公式. 

例 6.5 假设 Intel 股票的当前价格是每股80美元，年波动率为 a = 20%,进一步 
假设年无风险利率为8%.那么执行价格为90美元，而且在3个月内到期的 Intel 
的一个欧式看涨期权的价格是多少？ 

由假设，我们有朽=80, iC = 90, T-t = 0.25, < r = 0.2, 且 r = 0.08. 

因此 


h = ln(8Q/flO) + (0.08 + 0.04/2) x 0.25 
~0.2>/025 


-0.927 8, 


h _ - h + — 0.2^/025 = 一 1.027 8. 


利用统计软件（例如 Minitab 或 SCA) 或者附录 B 中的近似.我们有 


$(—0.927 8) = 0.176 7, $(-1.027 8) = 0.152 0. 

因此，一个欧式看涨期权的价格为 


ct = $80^(-0.927 8) - $90^(-1.027 8) exp (— 0-02) = $0.73. 
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对看涨期权的买者而言，只有股价升高 10.73 美元时，才能达到得失平衡. 
在相同的假设下，一个欧式看跌期权的价格为 


p t = $90 exp (—0.08 x 0.25) 少 (1.027 8) - $80^(0.927 8) = $8.95. 


这样，对于看跌期权的买者而言，股价可以升高额外的 1.05 美兀而达到得失平衡 • 
例 6.6 前面例子屮的敲定价格大大超出了当前股价.一个更现实的敲定价格是 
81美元.假设前面例子中其他的条件仍然成立，现在我们有朽= 80, K = 81, 
r = 0.08, T-t = 0.25,且〜变为 


_ ln (8( V 81) + (0.08 4- 0.04/2) x 0.25 
+ — 0.2 v /0^5 ~ 

h _ = h + - 0.2 y /0^25 = 0.025 775. 


= 0.125 775, 


利用附录 B 中的近似，我们有 $(0.125 775) = 0.550 0 和 $(0.025 775) = 0.510 3, 则 
一个欧式看涨期权的价格是 


c t = $80*(0.125 775) — $81 exp (-0.02) 中 (0.025 775) = $3.49. 

对于看涨期权的买者而言,股价必须提高 4.49 美元，才得失相等.从另一方面来讲, 
在同样假定下的一个欧式看跌期权的价格为 

p t = $81 exp (-0.02)$(-0.025 775) — $80^(-0.125 775) 

=$81 exp (-0.02) x 0.489 72 - $80 x 0.449 96 = S 2.89 

对看跌期权的买者而言，股票价格必须降低 1.89 美元，才得失平衡. 

6.6.3 欧式期权的下界 


考虑没有支付分红的股票的看涨期权.可以证明欧式看涨期权的价格满足 


ct > P t — K exp [- r(T — <)]. 

也就是说欧式看涨期权的下界是 P t - KeM - r ( T - t )}. 考虑如下两个组合可以验 
证该 结果： 

(1) 组合 A : —个欧式看涨期权加 Kexp [- r ( T - t )} 的现金. 

(2) 组合—股标的股票. 

对于组合 A , 如果将现金以无风险利率进行投资，则在: T 时刻的现金数量为 ，如 
果 /V > AT , 则 r 时刻执行期权，组合的价值为 iV 如果< K ， 则不执行期权, 
组合的价值为因此组合的价值是 


max ( Pr , if ). 
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组合 B 的价值在 r 时刻是 Pr . 因此组合 A 的价值要比组合 B 的价值大，或至少 
相同.从而今天组合 A 的价值也要比组合 B 的价值要大，即 

ct + K exp [— r(T — <)] > P t , or Ct ^ Pt — K exp [— r(T — *)]. 

进一步，由于 c * > 0,我们有 

ct ^ max(Pt — K exp [— r(T - Jt )]，0). 

用类似的方法可以证明，相应的欧式看跌期权满足 

Pt ^ max(/C exp [- r(T - *)] - P <,0). 

例 6 . 7 假定 P t = $ 3 0, AT = $ 28 ,年利率为 r = 6%, r - i -0.5. 在这种情形下， 

Pt-K exp [- r ( r - t )] = $[30- 28 exp (-0.06 x 0.5)] w $2.83. 

假定股票的欧式看涨价格为 S 2.50, 这比理论最小值 $2.83 要小.套利者可以买该看 
涨期权并卖空股票，这样便产生了一个新的现金流 $(30-2.50) = $27.50. 如果以无 
风险利率投资6个月.则 $27.50 变为 $27.50 exp (0.06 x 0.5) = $28.34. 在到期日，如果 
/V > $28,则套期保值者执行期权，并平了空头头寸.他获利 $(28.34-28) = $0.34. 
另一方面，如果 P T < $28,套利者可以从市场直接买股票平仓，他甚至可以获得更 
多的 利益. 作为说明，假定尸 r = $27.00, 则获利将是 $(28.34 - 27) = $1.34. 

6.6.4 讨论 

由公 式知， 一个看涨或看跌期权的价格依赖于5个变量，即当前的 股价巧 、敲 
定价格 A ' 以年度量的到期日 T - ts 年波动率 a 以及年利率 r . 值得研究的是这 
5个变量对期权价格的影响. 

1. 边际故应 

首先考虑这 5 个变量对一个看涨期权价格 Q 的边际效应.边际效应的意思是 
在固定其他变量的情况下改变其屮一个变量.一个看涨期权的效应可以概括如下. 

⑴当 前价格 c t 与 ln ( P t ) 正相关.特别地， 当巧 4 0时 ， Ct -4 0;当朽 - 0O 
时， c t — oo . 图 6-3 a 解释 f K = 80,年利率 r = 6%; T - < = 0.25 年以及年波动率 
= 30%时的效应. 

(2) 执行价 格尺： C < 与 \ n ( K ) 负相关.具体来讲，当尺 — 时， — 巧； 当 
/C —♦ 00时, C | — > 0. 
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U 2() 40 6D 801(K)120 0 20 40 6() 80100121) 

当前股价 当前股价 

图6~3当前股价对期权价格的边际效应，其中 /C = 80,7 1 - f = 0.25, <7 = 0.3, 
r = 0.06： ( a ) 看涨 期权； （ h ) 看跌期权 

可得到极限结果.若巧 < 欠.则当 （r - 幻 — 0时 Ct —(). 若巧 > 瓦，则 a 
(T 0 + 0时 c t +朽尺，且当 （r t ) ► oo 时 c t > / V 图 6-4 a 显示的是对三 
种不同的当前股价来说 ， r - «对 C < 的边际效应.固定的变量是= 80, r = 0.00 
和 o = 0.3. 实线、点划线以及虚线分别对 应于/ = 70,80,90. 

(») 0») 


(3) 到期 时间： c t 与 T -/. 的相关性非常复杂,但是通过将 / i + 和 / i _ 写成 

, \n{P t /K) , ( r + 0 V2)V^T 

+ - ; ’ 

t HPt/K) , {r-a 2 /2WT-t 

h- = - - H -, 

a\/T -t o 

( a ) ㈤ 


到期时问 到期时 M 

m 6-4 当前股价对期权价格的边际效应，其中 A ： = 80, a = 0.3, r = 0.06: ( a ) 看涨 期权: 
( b ) 看跌期权.实线、点划线和虚线分别表示当前的股价为尸 t = 70,80,90 








3t)2()10 
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⑷波动率 a : 通过将/1+和/改写成 


*+ = 


In(P t //T) + r(T-*) 



+ |v^rr. 


h ~ —~ ^/r^t - 

我们得到 （ a ) 如果 \n{P t /K) + r(T - <) < 0,则当 a — 0 时 ， q — 0; ( b ) 如果 
hx{Pt/K) + NT - t ) > 0,则当 c 4 0 时， c t > ^ c - rCT - t ). 当 a — oo 时, 
c t — P t . 图 G 5 a 表明 K = 80,T t = 0.25, r = 0.06 以及取 3 个不同值时 rr 对 
ct 的效应.实线、点划线以及虚线分别对应于 P t = 70,80,90. 



(5) 利率： ct 与 r 是正相关的， 满足： 当 r — oo 时， c ,.- 只. 

这5个变量对一个看跌期权的边际效应可类似得到.图 6>3 b 、 图 6-4 b 和阁 
6-5 b 对所选择的一些情况解释了其效应. 

2. —些联合效应 

图 ( Mi 表明波动率与敲定价格对一个看涨期权的联合效应，这里其他变量是固 
定的，巧= 80, r = 6%, T - 1=0.25. 正如所预 料的， 当波动率很高而且敲定价格正 
好低于当前股价时，看涨期权的价格更高.图心7显示同样条件下，对一个看跌期 
权的效应.当波动率很高而且敲定价格正好高于当前的股价时，看跌期权的价格更 
高.而且，图形也说明了随着波动率的增加.敲定价格对看跌期权价格的效应将变 
得更加线性化. 
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图6^7股市波动率与敲定价格对看涨期权的联合效应.其中 P t =80, T - t = 0.25, r = 0.06 


6.7 伊藤引理的扩展 

在推导定价公式时.一个衍生资产可能是多种证券的未定权益.当这些证券的 
价格由多因素驱动时,衍生资产的价格就是几个随机过程的函数.利率期限结构的 
两因子模型就是二维随机过程的一个例在本节中，我们主要讨论伊藤引理在几 
种随机过程情形下的扩展. 

考虑一个维连续时间过程: c t = ( xur - , x kt y . 这里 fc 是一个正常数.而且 
是一个连续时间的随机过程，且满足 

dx it =糾 (sct)di + i = 1, ••- ,k, (6.21) 

其中吻 是一个维纳过程.可以理解为漂移函数/^(以）与波动率函数 a ^ xu ) 也是 
时间指数 t 的函数.为了简化记号，我们将 f 从变量中省略.对 I ，维纳过程 

和 w jt 是不一样的.我们假定与 dw jt 的相关系数是这意味着叫是定义 
为 = ejAt 的两个标准止态随机变量~和 q 间的相关系数. 


m 6- G 股市波动串与敲定价格对看涨期权的联合效应， 其中朽 = 80 , T -( = 0.25, r = 0.06 











6.8 随机积分 

本节主要讨论随机积分，以便在假设资产的价格服从一个伊藤过程时可以得到 
该资产的价格.我们利用伊藤公式来推导积分结果.对该论题严格的处理，读者可 
以査阅随机积分的教科书首先，如同一个确定函数的通常积分一样，积分是差分 
的反面，因此，对于一个随机过程下式仍然 成立： 

dx, =Xt — xo. 

Jo 

貝体来讲，对维纳过程 u ； t ， 因为= 0,所以我们有 ( dw ^ Wt . 下面 T 考虑积分 

卜 J ° 

利用前面的结果，并取方程 (6.7) 的积分，我们有 
Jo 

tvf =尤 + 2 i w a dw 31 




因此 
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f w a dw a = rXwi —t). 
Jo z 

这不同于通常的确定积分，那里 

[ y^y = (y? - yo)/ 2 - 

Jo 


转到: Tt 是一个几何布朗运动的情况，即 A 满足 


dxt = /xxfdt + axtdwt, 

其中仏。是常数， a > 0 , 见方程 （6.8) .对 G ( x lt t ) - ln ( x t ) 利用伊藤引理，我们得 
到 2 

dln(ii) = (p - dt + ffdwt. 

取积分，并利用前面得到的结果，我们有 


因此 

且 


r 1 、 ( a 2 \ r 4 r * 

dln(x a ) — I n -- ) ds + <r dw g . 

,0 V ^ / Jo Jo 


ln(x t ) — ln(xo) + (/i — <7^/2^ + crwt. 


Xi = xq exp[(/i - a 2 /2)t 4 - aw t ]. 


对资产价格将记号: r t 改为巧，则我们在假设价格服从一个几何布朗运动时，对价 
格有一个解.此价格为 


Pt = Po exp[(/i - a 2 / 2 )t + crti； t ]. 


(6.25) 


6.9 跳跃扩散模型 

经验研究发现，基于布朗运动的随机扩散模型不能解释资产收益率及其衍生 
资产价格的一些特征（例如，隐含波动率的“波动率微笑”，见 Bakshi ， Cao 和 Chen 
(1997) 及其里面的参考文献).波动丰微笑指的是期权的隐含波动率为敲定价格的 
一个凸凼数.赔钱和赚钱的期权都倾向于比不赔不赚的期权有更高的隐含波动率. 
尤其在外汇市场中.证券期权对波动率微笑的重视较少.标准随机扩散模型的不足 
导致了其他连续时间模型的创建.例如.许多文献已提出跳跃扩散及随机波动率模 
型来克服这种不足；见 Merton (1976) 和 Duffie (1995). 
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股价的跳跃经常假定为服从一个概率法则.例如,跳跃可能服从一个泊松过程， 
它是一个连续时间的离散过程_对于给定的时刻令不表示在时间段上一 
个特定事件发生的次数.如果 

入 m pn 

Pr ( X t = m )= —— ' 7 - cxp (- A «), A > 0, 
ml 

则就是一个泊松过程，也就是说，叉，服从一个参数为 A / 的泊松分布.参数 A 控 
制了特定事件的发生，称之为过程的强度.正式的定义还要求 X ,是一个带有左极 
限且右连续的齐次马尔可夫过程. 

本节讨论了 Kou (2002) 提出的一个简单的跳跃扩散模型.这个简单模型有几 
个好的 性质. 模型隐含的收益率是有尖峰的、关于0点非对称的.此外，模型可以 
再生波动率微笑并对许多期权的价格提供解析公式.模型包括两部分，第部分是 
连续的，服从个几何布朗 运动； 第二部分是一个跳跃过程.跳跃的产生由一个泊 
松过程控制，并且跳跃的大小服从一个双指数分布 .令巧 表示资产在 f . 日、 j 刻的价 
格.简单的跳跃扩散模型假定价格服从随机微分方程 

^ = /idt + adw t + d ^2 (*/» - 1)^ , (6.26) 

其中叫是一个维纳过程, n t 是强度为 A 的泊松过程， {4} 是独立同分布的非负随 
机变量序列，满足 ； f = ln ( J ) 服从双重指数分布，而且概率密度函数为 

fx(x) = 0 <r] <l. (6.27) 

双重指数分布又称为 Laplacian 分布.在模型 （6.26) 屮， n t , 叫和4是相互独立的, 
以至模型的随机性之间没有关系，注意到 nt 是时间间隔上发生跳跃的次数, 
并服从参数为 AZ 的泊松分布,其中 A 是一个常数.在第/次跳跃中，价格跳跃的比 
例为一 1. 

双指数分布可写为 


v / 以概率0.5， 

A — K = < 

\ 以概率0.5， 

其中€是均值为％方差为的指数随机变量 . f 的概率密度函数为 
J(x) = ~ e ~ x ^ V t 0 < x < oo. 

双指数分布的一些有用性质为 

E(X) —K ， Var(JVT) - 2 V 2 , E(e x ) = -Hi-. 


(6.28) 
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对于有限样本.很难区别双指数分布与 < 分布.然而,双指数分布在解析上更易于处 
理，并且可以产生一个在均值周围的更高的概率集中度（例如更高峰).正如第1章 
所述的，观测到的收益率的直方图倾向于比正态密度有更高的峰.图 6-8 用实线表 
示了双指数随机变最的概率密度函数，虚线是一个正态随机变量的概率密度函数. 
两个变量的均值都是(〕、方差为 n.non 8. 从图 6-8 中可以很清楚看到双指数密度的 
高峰. 



-02 - 0.1 0.0 0.1 0.2 


图& *8 均值为0、方差为0 000 8的双指数随机变量和正态随机变量的概率密度函数. 
实线是双指数分布 

解方程 (6.26) 的随机微分方程，我们得到资产价格的动态规律 

n fc 

Pt = Pq exp[(/i — <t 2 /2)* 十 awt ] A , (6.29) 

<=i 

这里可以理解为 g = 1. 这个结果是方程 (6.25) 包含随机跳跃时的一般化.可以 
如下得到.令:次跳跃的时间.对于 t e [ O . tj ), 没有跳跃而且价格可以由 
方程 (6.25) 给出.因此，左面价格在时刻“时的极限为 

P t - = Po exp[(/i - <r 2 /2)ti 4- 
在时刻 L 价格跳跃的比例为 A - 1，使得价格变为 

Pti = (1 + — l )^ t - = ~ exp[(/x — or 2 / 2 ) t \ 4 - 

对于 < e 区间 { t u t ] 上没有跳跃，所以 

Pt — Pu exp[(M - or 2 /2)(t — < i ) + cr(wt - wtj ]. 

代入巧,，我们有 

Pt = Pq exp[(/i - a 2 / 2 )t + aw t \ J \. 
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重复这个方案，可得到方程 (6.29). 

由方程（6.29)，标的资产在一个小的时间增量上的简单收益率为 


Pt+At — Pt 

Pt 


exp 


( V ^#4 At 

M - 2 ff2 ) — wt ) 4- Xi 

f i=n t +l 


这里可以理解为，一个空集上的和为 0 , 且不 = In ( J ,)- 对于一个小 △<. 我们可以 
利用近似 c * ^ 1 | x I a ? 2 /2, 以及 6 . 3 节讨论的结果 ( Au ; t ) 2 « At , 得到 


~& » (ax -- a 2 ) △« +。△奶 + 冗 Xi + 

\ / i ^ n t I 1 

抑 f 十厶 t 

w fj,At + erey/At 4 - ^ 

<= n t +1 

其中 Awt = Wt^Ai - 仰，且 e 是一个标准正态随机变量. 

在泊松过程的假设下，在时间间隔 ( t,f + A <] 上有一个跳跃的概率为 AA < ，且 
多于一个跳跃的概率为 o ( At ), 其中 o ( At ) 意指： 如果我们将这一项用来除，则 
当趋子0时，它的值也趋子 0. 因此，对一个小的△<，忽略掉多个跳跃，我们有 

〜|"义 n t + l ， 以概率入 At , 

1 0, 以概率 l - XAt . 


与前面的结果相结合，可以看出标的资产的简单收益率的近似分布可由下式给出 

Pt ^ ^ + (^ ey/At 十 f x 久， (6.30) 

其中/是伯努利随机变量，且 Pr (/ = 1) = AAt , Pr (/ = 0) = 1 - AAt ; X 是方程 
(0.28) 中定义的双指数随机 变量.无跳跃 时方程 （6.30) 简化为一个几何布朗运动. 

令 G = 十 aey/At + / x X 表示方程 (6.30) 右面的随机变量，利用模型中 
用到的指数分布与正态分布的独立性 ， Kou (2002) 得到 f G 的概率密度函数为 

捧 尝一卜 , ( 球卜 ( 球 ) } 

+ (l ' ^ TTS 1 )' ( 6 . 31) 

其中 = a : - / xAf - 〜 并且 /(.) 和 $(•) 分别是标准正态随机变量的概率密度函数 
和累积分布函数.另外， 


E ( G ) = fiAt + KXAt , Var ( G ) = a 2 A < + XAt [2 rj 2 4 - k 2 (1 - AA *)]. 




图 6-9 显示了正态分布与方程 (6.31) 的分布的概率密度函数的一些比较.两个分 
布的均值都是0、方差都是 2.057 2 x 10-1 均值和方差是通过假定标的资产的年 
收益率满足 // = 20%, <7 = 20 % ， - 1 天-1/252年 ， A = 10,《 = -0.02, r / = 0.02 
而得到的.换句话说，我们假定毎年大约有 1() 天跳跃，〒均跳跃大小为-2%.跳跃 
波动率为2%.这些值对美国股票是合理的.从图中，可以清楚地看到由方程 (6.26) 
的跳跃扩散过程推导出的分布的尖峰态性质.该分布比相应的正态分布有更髙的 
峰和更厚的尾巴. 


⑷密度函数 (c) 左 尾比较 



图6~9正态分布和方程 (6.31) 分布的密度比较.点线表示 IE 态分布.两个分布的均值都是0、 
方楚都是 2.057 2 x 10-' (a) 整体 比较； （b) 央峰的 比较； （c) 左尾； （d) 右尾 

跳跃扩散下的期权定价 

当随机跳跃出现时，市场将变成不完全的.在这种情况下，标准套期变量对期 
权定价就不再适用了.但我们仍可以推导出不依赖于对风险的态度的期权定价公 
式.方法是假定可利用的证券数量非常大，以至于突然跳跃的风险是可以分散的, 
并且市场因此对超过无风险利率的部分承担风险时将不支付风险溢价.换句话说, 
对于风险溢价的一个给定集合，可以考虑风险中性测度尸•，满足 

= [r — \E(J - l)]d<t ) adw t I d [ (*/•-!•) 

1 ,t=l 

=(r - A0)dt 4 - adw t + d ( Jj — 1)1 , 


其中 r 是无风险利率，•/ = exp ( X ) 满足； T 服从方程 (6.27) 的双指数分布，0 = 
e"/(l - T/ 2 ) - 1, 0 < r, < 1. 考虑风险溢价时，参数%必和 rr 变成了风险中件参 
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数 . 具体可参见 Kou (2002 ). 前面方程的唯一解为 

Pt — P 0 exp - y - A#’) t + j fj J». 

为了对跃扩散模型中的一个欧式期权定价，剩下的就是计算期权折现的最终回报 
在测度下的期望 . 具体来讲，一个欧式看涨期权在 < 时刻的价格可以由下式给 
山 


E*[ e - r ( T _*)(/V - /0 + ] 


E. 


•r(T-t) 


Pi exp [j^) (T-t) + <jVT^~tE 


,(6.32) 


其中 T 是到期日， (T-t) 是用年测量的离到期日的时间 ，尺 是执行价格， {y) + - 
max(0,j/),e 是标准正态随机变量 . Kou(2002 ) 证明了 c* 在解析上是可以处理的，因 
为 




-HT-t) 


X n {T-t) n ( 2n - j 

~~~22^* l n-1 


x 4 - A 2 ,n,j + ^3,n,j) 

其中以是标准正态随机变量的累积分布函数， 


(6.33) 


咖 )- e - r(r _ ㈣ M, 


U e 2L ( i -^ ' u + 卵 

A 0 . = i e -r(T-t)-w/ V +a a {T-t)/{2r, a ) K 
2 

X § [(^ V 7 - 1 ] 去丑岵-)， 

A 3nj = I e - r ( T - t > +tu M^(^-*)/(2»? 2 )^ 

x § l 1 一 (TT^l i^r 1 ) ▲叫 c+) ’ 

ll 

b 士 

fht 


c ± 


In(F t /K) + (r 土 a 2 /'! - Xip){T - t) + uk 
ayJT-t ~ 

ln(P t //Q + (r 土 cr 2 /2 - \ip){T - t) 
as / T^t ~ 
ay/T — t w 


T l 


<ry/T~~t' 
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w = \ n ( K / P t ) + hji{T a 2 / 2 )(T - t )- n / c , 



而函数 Hh ^) 定义为 

1 2 

Hhi { x ) = J (s — x ) n e ~ s 2/2 d « n = 0, l , ••- t (6.34) 

且有 Hh- } (x) = exp (- d /2), 当 /( z ) 是一个正态随机变量的累积分布函数时，它 
就是 y/2^f(x). 详见 Ahmnmwitz 和 Stegun (1972). 函数 Hh n (x) 满足下面的递推 
公式 

nHh n (x)^ IIh n - 2 (x) - xHhn-i(x), n ^ 1, (6.35) 

初始值为 Hh-\{x) = e _a：3 / 2 , 且 Hh 0 (x) = y/27r^(-x). 

定价公式涉及一个无穷序列，但是它的数值可以通过截断 （ tnmoLtimi )( 例如， 
前10项）快速而精确地 逼近. 如果 A = 0( 即没有跳跃)，则很容易看到对子前面讨 
论的看涨期权而言， o 简化为 B ^ S 公式. 

最后，考虑跳跃扩散模型的条件下，一个欧式看跌期权的价格可以通过涨-跌 
平价得到，即 

灼= c * 十 - P t . 

在方程 (6.26) 的跳跃扩散模型下的其他期权定价公式可以参见 Kmi (2002). 

例 6 . 8 考虑例 6. 6 中的股票，当前价格为 $80. 如前，假定欧式期权的敲定价格 
为 K = $S5, 且其他参数为 r = 0.08, T-i = 0.25. 另外，假设股价服从方程 (6.26) 
中的跳跃扩散模勒.参数为 A = 10, #c = -0.02, // = 0.02. 换句话说，每年大约有 
10个跳跃，平均跳跃大小为- 2 % 旦眺跃波动率为2%. 利用方程 (6.33) 中的公式， 
我们得到 c t = 3.92, 当没有跳跃时高于例 6.6 中的 $3.49. 相应的看跌期权假定为 
Pt - $3.31, 也比我们以前的高很多.正如所期望的，当保持其余参数不变，加入跳 
跃时就增加了两种欧式期权的价格.然而，请注意，实际应用时，在股价屮加入跳跃 
过程经常导致股票波动率 a 的不同估计. 

6.10 连续时间模型的估计 

下面我们考虑直接从离散样本数据中估计扩散方程（即伊藤 过程） 的问题.这 
里漂移函数 H ( x t , t ) 和波动率函数 a ( x t , t ) 都是时变的.并可能不服从一个具体的 
参数 形式. 这是近年来引起人们很大兴趣的一个主题.具体方法的细节超出了本章 
的 范围. 因此我们仅对文献由提出的方法简要介绍一下.有兴趣的读者可以査阅相 
应的文献以及 Lo (1988). 
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估计一个扩散方程时有几种可以利用的方法.第一种方法是拟最大似然方法， 
它利用了 (1仙在一个很小的时间间隔上是正态分布的 事实. 参见 Kessler (1997) 及 
其参考文献第二种方法是矩方法.参见 Conley, Hansen, Luttraer 和 Scheinkman 
(1997) 及其参考文献第二.种方法是利用非参数 方法. 参见 Ait-Sahalia (1996, 
2002). 第四种方法是利用半参数方法和再投影 （ ivpmjMtion ) 方法 • 参见 Gallant 
和 Long (1997)， Gallant 和 Tauchen (1997). 最近,许多研究者已经开始利用 MCMC 
方法来估计扩散方程.具体可参见 Eraker (2001) 以及 Elerian, Chib 和 ShephaH 
( 2001 ). 


附录 A B - S 公式积分 

本附录将推导出方程 （6.19) 给出的欧式看涨期权的价格.令 a ： = ln ( Pr ), 利用 
变量代换以及 9 ( Pt )^ Pt = f { x ) dx , 其中/ ㈤ 为 x 的概率密度函数，我们有 

c t = cxp{—r(T — fc)] J {F^r — ^)9 {,Pt)^Pt 

=e_ r ( T _*) 「 （ e* - K)f(x)dx 


r(T-e) 


c x /(x)dx - K f(x)dx 
tix(K) Jln(fr) 


(6.36) 


因为 a : = ln (/ V ) 〜 AT 【 lu ( P t ) 十 — 所以方程 (6.36) 中第二 
项的积分简化为 


>00 

• ln(K) 


rln(ff) 

/(x)dx = 1—| f[x)dx 

J X 

=1 - cdf(ln(iC)) 


其中 C df ( ln ( iO ) 为 x = ln ( Pr ) 的累积分布函数在 ln ( AT ) 处的取值，办 ㈠ 是标准正 
态随机变量的累积分布函数，而且 

, lu(K) - HPt) -(r- a 2 /2)(T-t) 

一 h— = - -f - 

a\/T t 

- \n{P t /K) -{r- a^^T-t) 

= aVT-t * 


方程 （6.36) 中第一项的 积分吋 以写为 


Mn(fC) 


s /2^ y / a 2 ( T - t ) 


exp x - 


[x-ln(P t )-(r-^/2)(T-t)] 2 ' 


da：. 
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其中指数可以简化为 

[x-HPd-ir^a^n^T-t )} 2 

- 2 a 2 { T - t ) 

_ [x-{ln(P t ) + (r + ff 2 /2)( r -0} ] 2 
2a 2 (T-t) 

因此，第一个积分变为 


In ⑻ + r ( r - t ). 


e I /(x)dx 


Jln(#n 

Pte r(T-0 


exp 


[x-WP^ + ir + a^^T-t)}}^ 
~2rr 2 (T - t) 


dx, 


它包含了一个均值为 + 方差为 cr 2 (T t ) 的正态分布的累 

积分布 函数. 利用前面证明第二个积分的同样方法，我们有 


, lnl #0 


e 2 f { x)dx = P t e r ( T - M (/» + )， 


其中 h 由卜式给出 


t _ hx(P t /K)+(r + ay2)(T-t) 

十 asfT^i . 


将两个结果结合，我们就有 


ct- - K^>(h-)] = 巧中 (/i+) _ Ke-^ rt) 9(h.). 

附录 B 标准正态概率的近似 

—个标准正态随机变量的累积分布函数 cdf ^( x ) 可以近似为 

$ ⑷ _ | 1 _ /(*)[ciA: + c 2 k 2 + c 3 fe 3 + c 4 fe 4 + c 5 A; 5 j, 若 ; r 彡 0 ， 

1 l - O (- x ), 若 x <0. 

其中 f(x) = exp(-x 2 /2)/v/27r,fc = 1/(1 + 0.231 641 9x), ci - 0.319 381 530, c 2 = 
-0.356 563 782 , c 3 = 1.781 477 937, c 4 = -1.821 255 978, e 5 - 1.330 274 429. 

例如，利用前面的近似，我们得到 $(1.96) = 0.975 002, $(0.82) = 0.793 892, 
争 (-0.61) = 0.270 931. 这些概率与个典型的正态概率表中得到的值非常接近 • 

练习题 


B -1 假定对数价格 p , = ln ( P t ： i 服从一个随机微分方程 


dpt = 7 dt + adwt, 
其中奶是一个维纳过程.试推导价格 a 的随机方程. 
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6.2 考虑一个不支付红利的股票的远期价格 F ， 我们有 

F ltT = 

其中 r 是无风险利率，它是 常数； 忾是当前的 股价. 假设 M 服从几何布朗运动 
dP t - /ifVdt 十 aPtdwt. 

试推导 F t , r 的随机微分方程. 

6.3 假定 IBM 股票的价格服从伊藤过程 

dP t = /iFtdi + cr ^ tduH , 

其中 M 和都是固定的，是一个标准的布朗 运动. 考虑 IBM 股票在1997年的日对数 
收益率.平均收益率与样本的标准差分别为 0.001 31和 0.022 15. 假设1997年有252个 
交易日，运用此数据来估计参数 M 和 t 

6.4 假设一只股票的当前价格是每股120美元，年波动率 < r =50%. 进一步假定年无风险利率 
为7%,且该股票不支付红利 .（ a ) 这只股票的敲定价格为 S 125 且到期时间为3个月的欧 
式看涨期权的价格是多少？ （ b ) 这只股票的敲定价格为$ 118且到期时间为3个月的欧式 
看跌期权的价格是多少？如来年波动率增加到80%,那么两种期权的价格分别是多少呢？ 
6.5 推导一只股票的欧式看跌期权中5个变量忾 ， 了 _ t , 及 r 的极限边际效应. 

0. B 股票当前的价格为每股60美元，并 M •服从几何布朗运动 

dPt = /iPtdt + aPtdt. 

假设该股票的年期望收益芊为 A 年波动率为40%,问股价在两年内的概率分布是什么？ 
试求该分布的均值和标准差，并目对此股价构造一个95%的置信区间. 

6.7 当前股价为毎股60美元.并服从几何布朗运动 

APi — /iAdt 十 crFedt. 

假设该股票的年期望收益率为叫年波动率为40%.问股票两年的连续复合收益率的概率 
分布是什么？试求此分布的均值和标准差. 

6.8 假设股票 A 的当前价格是每股70美元，此价格服从方程 (6.26) 的跳跃扩散模型.假定 
年无风险利率为8%,股票不分红，年波动率为30%.另外，价格平均每年大约有15个跳 
跃 1 平均的跳跃大小为_2%，跳跃波动率为3%.问敲定价格为$75且到期时间为3个月 
的一个欧式看涨期权的价格是多少？相泡的欧式看跌期权的价格是多少？ 
e .9 考虑没有分红支付的股票的欧式看涨 期权.假定巧 = S 20, K = $18,年利率为 r = 6%, 
r — t = 0.5 年.如果股粟的欧式看涨期权的价格是 $2.10, 套利者有套利的机会吗？ 

6.10 考虑没有分红支付的股栗的欧式看跌期权 • 假定 A = $44, «• = $47, 年 利举为 r = 6%, 
T t = 0.5 年.如果股票的欧式看跌期权的价格是 $1-00, 套利者有套利的机会吗？ 
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图 7-1 1962 年 7 月 3 日至 1998 年 12 月 31 日 IBM 股票日对数收益率的时间图 

7.1 风险值 

佥融市场中有几种类型的风险，其中三个主要类别的金融风险是信用风险、流 


在金融市场中极端的价格运动虽然少见，但很重要.1987年10月华尔街股市的 
崩盘以及其他大的金融危机（例如长期资本管理 ， Long Term Capital Management ) 
已经引起了实际应用者和研究者们的广泛关注.一些人甚至呼吁政府加强对衍生证 
券市场的监管.近年来，高科技股表面上很大的日价格变动进一步产生了关于市场 
风险以及金融机构保证金设置的 讨论. 因此，风险值 （Value at Risk , 简记为 VaR ) 成 
为在风险管理中广泛使用的市场风险的度量标准 • 

本章主要讨论计算 VaR 的各种方法以及这些方法后面的统计 理论. 特别地，我 
们考虑在统计文献中发展起来的极值理论来研究稀少（或异常）事件及其对 VaR 
的应用.其中极值理论的条件概念与无条件概念都在讨论之列.金融头寸 VaR 计 
算的无条件方法需要用到计算 VaR 所涉及的金融工具的历史收益率.然而，条件方 
法则运用历史数据弓解释变量来计算 VaR . 

本章讨论的其他计算 VaR 的方法是风险度量制 ( RiakMetrics ), 波动率模型的 
经济计量模型以及经验分位数.我们利用 IBM 股票的日对数收益率来解释所有所 
讨论方法的实际计算.囚此，得到的结果可以用来比较不同方法的表现•图 7 _1 描 
述了 IBM 股票从1962年7月3日至1998年 I 2 月 3 1 日的日对数收益率，共 
9 190个观测值的时间图. 
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动性风险以及市场风险. VaR 主要讨论巿场风险，但是它也可以应用于其他类型 
的风险. VaR 是在某个风险范畴中的机构的头寸在一个给定持有期间内可能会由 
于一般的市场运动而降低所带来的损失的统一估计.对 VaR 的一般阐述，可参见 
Duffle 和 Pan (1997) 以及 .lorion (1997). 金融机构可以利用这一尺度来评估他们的 
风险，或者通过一个管理委员会设定边际要求.在其他情形，可以用 VaR 来确保金 
融机构经过一个灾难性事件之后仍然可以运转.从金融机构的角度， VaR 可以定义 
为金融头寸在一个给定时间段上，以某个给定的概率发生的最大损失.以这种观点， 
可以将 VaR 看作是在正常市场条件下与稀少（异常）事件相联系的损失的一个度 
量.换句话说，从管理委员会的角度， VaR 可以定义为在异常市场情境下的最小损 
失.两种定义尽管概念上貌似相差很远，但都将导致同样的 VaR 度量. 

下面，我们在概率框架下定义 VaR . 假设在时间指标 t 点，我们感兴趣的是接 
下来的 Z 段中一个金融头寸的风险.令 AK (/) 表示金融头寸中，从时刻 f 到时刻 
t + l 时资产价值的变化.这个数童用美元度量.且在时间指标为 < 时是一个随机变 
量•用 FM 表示 AV(l) 的累积分布函数 ( cdf ). 定义一个多头头寸在持有期/中 
概率为 p 的 VaR 为 

p = Pr [ AK ( Z ) ^ VaR ] = F /( VaR ). (7.1) 

因为当△!/(〖）< 0时，一个多头金融头寸的持有者遭受损失，所以当 p 很小时，方 
程 （7.1) 中定义的 VaR 是一个负值,其中负号表示一个损失.由定义，在时间区间 f 
上，持有者将要遭受的损失大于或等于 VaR 的概率 p . 换一种说法, VaR 可以解释 
如下： 以概率1 - p , 金融头寸的持有者在时间区间/上遭受的潜在损失小于或等 
于 VaR . 

当资产价倌增加[即⑴:> 0] 时，空头头寸的持有者遭受损失，这时 VaR 定 

义为 

p = Vr [ AV ( l ) ^ VaR ] = 1 - Pt \ AV (1) ^ VaR ] = 1 — F /( VaR ). 

对于一个小 p ， 空久爻寸的 VaR 为一个正值，其中正号表示个损失. 

前面的定义显示 VaR 关注的是累积分布函数 F ,( x ) 的尾部行为.对一个多头 
头寸， F^x) 的左尾很重要，然而对空头头寸则主要关注于 b\{x) 的右尾.注意到如 
果利用- △ WO 的分布， 则力程 （7.1) 中 Vali 的定义也可以应用于空头头寸.因此， 
仅利用多头头寸米讨论 VaR 计算的方法就足够 

对任何一元的累积分布函数 F t {x) 与概率 p (0 < _p < 1)，称 

x p = ixd{x\Fi(x) > j?} 

为巧⑷的 P - 分位数，其中 inf 表示满足 F t (x) ^ v 的最小实数.如果已知方程 
(7.1) 中的累积分布函数 巧 ㈤ ，则 VaR 就是它的 p - 分位数（即 VaR = %).然而 
实际中 cdf 是未知的，从而对 VaR 的研究主要关心的是 cdf 及其分位数的估计，尤 
其是 cdf 的尾部性质. 
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在实际应用中， VaR 的计算涉及如下几个因素. 

(1) 感兴趣的概率 p , 例如 p = 0.01 或 p = 0.05. 

(2) 时间区间 /. 它可由管理委员会设定，例如1天或10天. 

(3) 数据频率.它可能与时间区间/不一样且经常使用日观测值. 

(4) 累积分布函数 F t { x ) 或它的分位数. 

(5) 金融头寸的数量或者证券组合的盯市价值 （ market - to~market value ). 

在这些因素中，累积分布函数 F t ( x ) 是经济计量模型的焦点，累积分布函数估计的 
不同方法引起了 VaR 计算的不同方法. 

注释1: 方程 (7.1) 中的 VaR 定义足用美元度 量的. 因为对教收益率近似等 

于金融头寸价值的百分比变化，所以在教据分析中我们使用的是对教收益率 r f . 给 
定 t 时刻已知信息的条件 T . 由 r t + i 分布的分位教计算的 VaR 用百分比表示.因 
此 VaR 的美元计量为金融头寸的现金值來以对数收益率序列的 VaR . 即 VaR =现 
金值 X 对数收益率的 VaR . 必要的时候，可以使用近似 VaR =现金值 x [ exp (对数 
收益率的 VaR )—1]. □ 

注释2: VaR 关注的是组合在给定时间区间上的可能损失的一个预测.可以 

利用金融头寸未来收益率的预測分布来计算.例如.使用日收益率 o 且组合在1天 
持有期的 VaR 可以利用 r t +1 在给定 f 时刻已知信息下的预測分布来 计算. 由统计 
的現点 T 在一个恰当指定的模型中，预测分布考虑了参數的不确 定性. 然而，预測分 
布很难得到，并且大多數 VaR 计算可以利用的方法都忽视了参数不确定性的影响. 

□ 


7.2 风险度量制 

• I . P . Morgan 将风险度量制方法发展到了 VaR 计算中.详见 Longerstaey 和 
More (1995). 风险度量制的简单形式假定组合的连续复合 FI 收益率服从一个条件 
正态分布.用表示日对数收益宇，巧^表示 f -1 时刻可以得到的信息集合.风 
险度量制假定〜 N ^ of ), 其中 / x t 是 n 的条件均值， W 是 r t 的条件方差. 
另外，这个方法假定这两个量是随时间变化的，对应于简单的 模型： 

/it = 0, of = aof ^ - f - (1 - 0 < a < 1. (7.2) 

因此，此方法假定组合的日价格的对数 p * = bx { Pt ) 满足差分方程 P < - Ph = a t ，其 
中= AG 是一个无漂移的 1 GARCH (1,1) 过程 . u 的值通常取在区间（0.9, 1) 上， 
其中一个代表值为 0-94. 

这样一个特殊的随机游动 IGARCH 模型的良好性 质是： 利用它很容易得到一 
个多期收益率的条件分布.具体来讲，对 it 个周期的持有期，从时刻《 + 1到时刻 
*+ ib (包含 t + * 时刻）的对数收益率为 r t [fcj = r t+1 +…+ r t + fc _ i + r t + k . 方括号 [ A :] 
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表示 k 期收益率.在方程 （7.2) 中具体的 IGARCH (1,1) 模型下，条件分布 r ,[ A ： J | F ( 
是均值为0、方差为 a t 2 [ fc ] 的正态分布，其中 af [ k ] 可以利用笫3章讨论的预测方 
法汁算.由的独立性假定和模型 (7.2), 我们有 

k 

a t 2 ( fc ] = Var ( r t [ fe ]| F t ) =工] Var(a … 

其中 Var ( a t +1 | F t ) = 可以递推得到.利用=叱_! = 我们 

可以将方程 （7.2) 屮 IGARCH ( U ) 模型的波动率力程改写为 

= af-i + (1 - - 1)，对所有的 <- 

特别地，我们有 

°f-H — 十（工 _ a )°f+<-l ( e t+«-i _ 1 )， i = 2, ••- ,k. 

因为对 i 彡 2, - l | F f ) = 0, 所以前面的方程说明 

E« 1 |^)=E(a? +i _ 1 |F t ) 1 * = 2, (7.3) 

对向前1步的波动宇预测，由方程 （7.2) 知 of +1 = aof + (1 a)rl 因此，方 
程 (7.3) 证明了对 i > 1， VeLr ( r t + i \ F t ) = < r ? +1 , 从而= k < rf +1 . 结果说明 
rt [ Aj ]| F t - iV (0， A ^ +1 ), 因此，在方程 (7.2) 的这个特殊的 IGARCH (1，1) 模型下， 
rt[k] 的条件方差与时间段 A : 成比例 • 持有期对数收益率的条件标准差为 ^ka t+l . 

假定金融头寸是一个多头头寸，以致当有一个人的价格下降（即一个大的负收 
益率）时损失发生.如果设定概率为5%，则风险度量制是用 1.65 tr t+1 来度量证券 
组合风险.即它利用均值为 U ， 标准差为 < r t +1 的止态分布的单侧5%分位数.真实 
的 5 %分位数是 _ l . 6 5 a t +1 ， 但是忽略了负号,并理解为它代表一个损失.因此，如果 
标准差是用白分比度量的，则风险度量制下证券组合的日 VaR 为 

VaR =头寸数量 x 1.65< t <+ i , 

k 天持有期的 VaR 为 

VaR ( A :) =头寸数量 x 1.65\/ fccr t+1 , 

其中 VaR 的变量 （ fc ) 用来表示时间段.因此，在风险度量制下，我们有 
VaR ( fc ) = Vkx VaR , 

并称之为风险度量制下 VaR 计算 的时间平方根 法则. 

例 7.1 1997年德国马克/美元的汇率的连续复合日收益率的样木标准差大约是 

0 53%.假定一个投资者长期持有价值1千万美元的3克/美元汇率合约，则该投资 
者1天持有期的 5% VaR 是 
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10 000 000 x (1.65 x 0.005 3) 美元= 87 450美元 • 


相应的1个月持有期 （30 天）的 VaR 

10 000 000 x (\/30 x 1.65 >c 0.005 : i) 美元;《 478 983 美元. 

例 7.2 考虑图 7-1 中 IBM 的 H 对数收益率.正如第1章中提到的，收益率的样 
本均值显著地不同于 0. 然而，为了说明利用风险度量制的 VaR 计算，我们假定这 
个样本的条件均值为0,而且收益率的波动率服从一个无漂移的 IGARCH (1，1) 模 
型.拟合的模型为 

r t = «t, a t — eri£t, cr\ — 0.939 + (1 — 0.939 6)at_j, (7.4) 

其中是标准的高斯白噪声序列.如所料想的，由 Q 统计量，拒绝/这个模型. 
例如，对于标准残差的平方，我们有一个高度显著的统计量 Q (10) = 56.19. 

由数据与拟合的模型.我们有 r 9190 = -0.012 8, <7? 190 = 0.000 347 2. 因此 ，一 
步向前波动率预测为的 19 以1) = 0.000 336. 条件分布 r 9191 | F 9190 的5%分位数为 
-1.65 x n /0.000 336 = -0.030 25,这里将负号理解为表示损失.因此,1千万美元的 
多头头寸在1天持有期内的 5% VaR 为 

VaR = 10 000 000 x 0.030 25 美元= 302 500 美元. 

1%分位数是 -2.326 2 x >/0.0()0 336 = -0.042 65,相应的相同多头头寸的 l%VaR 
为426 500美元 • 

注释：为了应用 S-Plus 中的风险度量制，我们可以用 mgarch (多元 GARCH ) 
命令下的 ewmal (一阶指数加权滑动平均）来估计1 - a . 然后用命令 predict 获 
得波动率预测.对于所用的 IBM 數据 . a 的估计是1-0.036 = 0.964 ,波动牟的向 
前一步预测是 知刚⑴ =0.018 88. 具体参见下面的演示.可算得对于 p = 0.05 和 
p - 0.01，分别有 VaR - 311 520美元和 VaR = 439 187美元.这两个 VaR 值要比 
例 7.2 給出的值稍小•例 7.2 是基于 RATS 程序给出的估计. 口 


S - Plus 演示 


输出结果已经简化. 


>ibm. risk=mgarch(ibm 〜 -1 , 〜 ewmal) 


>ibm.ri8k 
ALPHA 0.036 


>predict(ibm.risk»2> 
$sigma.pred 


7.2.1 讨论 

风险度量制的一个优点就是简单，很易子理解和运用.另外一个优点是它使得 
金融市场中的风险更加透明了.然而，因为证券收益率常常有厚尾（或肥尾)，所以 
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正态性假定通常导致 VaR 的低估.其他计算 VaR 的方法也要避免作这样一个假 

定. 

时间平方根法则是风险度量制中运用特殊模型的一个结果.如果对数收益率的 
零均值假定或者具休的 IGARCH (1,1) 模型假设不满足，则此准则就失效了.考虑 
下面这个简单 模型： 


r t = / x-f a t , at = ote t , A * # 0, of = + (1 - 

其中是标准的高斯白噪声序列. / x ^ O 的假定对许多在 NYSE 中大量交易的 
股票收益率都是成立的（见第1章)-对子上面这一简单模型，给定尺下 nn 的 
分布服从 N ^ aj + X ). 用来计算1天持有期 VaR 的5%分位数变为// - 1.65 a t+1 _ 
对一个 fc 天持有期.给定 F t 下的分布服从 N { k ^ ka 2 t ^ i ), 其中同前面一样， 

r t [ A :] = r t+1 十 - h + n + fc - k 天持有期 VaR 计算中运用的5%分位数是 

k ^-\ mVka t+x = 1.65 cr t + i ). 因此，当平均收益率不为0时， VaR ( A :) ^ 

V^x VaR . 同样很容易证明当收益率的波动率模型不是无漂移的 IGARCH (1,1) 模 
型时，此方法也是失效的. 


7.2.2 多个头寸 

在些应用中，投资者可能持有多个头寸，并且需要计算头寸的全部 VaR . 做 
这样一个计算时，在假定每个头寸的日对数收益服从个随机游动 IGARCH (1，1) 
模型下，风险度量制采取了一个简单方法.需要的额外垦是收益率间的交叉相关系 
数.考虑两个头寸的情况.令 VaR T 和 VaR 2 表示两个头寸的 VaR , 并且令 p 12 表 
示两个收益率间的交叉相关系数.即 m = Cov(r u ， r2t )/[Var( ru )Var(r 2t )】 a6 . 则投 
资者的全部 VaR 为 


VaR = ^ VaR ? + VaR | 4 - 2 /> 12 VaR , VaR a . 


—个包含 m 个工具的头寸的 VaR —般式 Pj 由下式 得到: 


VaR 


VaR ? + 2 [ p ij VaE , VaR it 


其中是第 i 个与第 j 个工具的收益率间的交叉相关系数， VaR , 表示第 i 个工 
具的 VaR . 


7.3 VaR 计算的计量经济方法 

VaR 计算的一个一般方法就是利用第2章到第4章中时间序列的经济计量模 
型.对于一个长期收益率序列，可以利用第2章中的时间序列模型来对均值方程建 
模，并且可利用第3章或第4章的条件异方差模型来处理波动率.为了简便.我们 
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在讨论中利用 GARCH 模型，并将此方法称为 VaR 计算的计 量经济 方法.也可以 
利用其他的波动率模型（包括第4章中的非线性模型). 

考虑某资产的对数收益率 r t . 它的一般时间序列模型可以写为 

V q 

^ (7.5) 

i=l J=1 

(H = <y t E U 

u V 

= go + aia ^ (7.6) 

i=l j=l 

方程 （7.5) 到 （ 7 .6) 是 n 的均值和波动率方程.假定参数已知时，可以利用这两个 
方程来得到 r , 的条件均值与条件方差的1步向前预测.具体地.我们有 

P 9 

6 ⑴ =<I>0 + Y1 0in+i-i - 


of (1) = Qo 十 -‘十 

j ― 

如果进一步假定^是髙斯的，则给定/时刻可得信息的条件下， r t+1 的条件分布服 
从 N [ r t ( l ), 片 (1)1 .用 VaR 计算的这个条件分布的分位数可以很容易得到.例如， 
其5%分位数是 f t ( l ) 1.656(1). 如果假定^是自由度为 v 的标准化的学生分 
布，则分位数为 r t ( l ) - fMdtil ), 其中 t ：( p ) 表示自由度为 r 的标准化学生分 
布的 P - 分位数. 

自由度为 r 的学生 f - 分布（用~表示）的分位数与它的标准化分布（用 G 表 
示）的分位数之间有如下 关系： 


p - Pr (t v 彡 g) = Pi 


t v 


y / v!{v - 2) s / v/{v - 2) 


Pr C ^ 


y / v/(v - 2) 


其中 i ； > 2 . 也就是说，如果 g 是自由度为 V 的学生分布的 p - 分位数.则 
H / y / v/{v - 2) 就是白由度为 t 的标准化学生分布的 p - 分位数.因此，如采力 
程（ 7 .6)的 GARCH 模型中的 Q 服从自由度为 r 的标准化学生 t - 分布且概率为 p ， 
则在时刻 t 时，用来计算1天持有期 VaR 的分位数为 


r t ( l ) + 


t v { p )& t ( l ) 

y / v /( v - 2) 


其中 tv{p) 是自由度为 r 的学生分布的 p - 分位数，这里假定 p 的绝对值很小， 
且 P 为负值. 

例 7.3 再次考虑例 7.2 中 IBM 的日对数收益率.我们利用两个波动率模型来计 
算一个长期头寸1千万美元在 f = 9 190时1天持有期的 VaR . 根据第2章与第3 
章中的建模方法.这些计量经济模型是合理的. 




情形 1 

假定&是标准正态的，则拟合的模型为 
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r t = U.UOO 66 - 0.024 7r t _ 2 + a ei a t = a t e u 

erf = 0.000 003 89 + 0.079 9 a ?_! 4- 0.907 3 a ?. 

由数据，我们有 r 9 i 89 = -0.002 01, r 9190 = -0.012 8, ag 190 = 0.000 334 55. 因此， 
前面的 AR(2)-GARCH(1,1) 模型产生的 1 步向前预测为 

r 9 i 9 o ( l ) = 0.000 71, ff9i 90 ( l ) = 0.000 321 1. 

5% 分位数为 

( J . UU 0 71 - 1.649 9 x V 0.0 U 0 321 1 = -0.028 77, 

这里负号理解为表示条件正态分布的左尾,长期头寸1亿美元概率为 0.05 的 VaR 
为 VaR = 1() 000【)00 x 0.0287 7美元= 287 70() 美元.结果表明，假定 AR (2)_ 
GARCH (1,1) 模型成立，则以概率95%,下一天持有此头寸的潜在损失是287 200 
美元或低于这个值.如果概率为 ().01, 那么1%分位数为 

0.000 71 - 2.326 2 x \/0.000 321 1 = -0.040 973 8. 

头寸的 VaR 变为409 738美元. 

情形2 

假定^是自由度为5的标准化学生^分布.拟合的模型为 

rt = 0.000 3 — 0.033 brt-2 + at = ( Tt £ t , 

a ? = 0.000 003 + 0.055 9 a?_j + 0.935 (Jofy 

由数据，我们有 f 9 i89 = -0.002 01, r g wn = -0.012 8, ^ l90 = 0.000 349. 因此，前面 
的学生 - fAR (2)- GARCH ( l , l ) 模型产牛的 1 步向前预测为 

r 9 i 9 o ( l ) = 0.000 367, ^ 190 (1) = 0.00(】338 6. 

自由度为 5 的学生分布的 5% 分位数为 -2.015, 它的标准化分布的 5% 分 
位数为 -2.015/v/5/3 = -1.560 8. 因此，给定 F 9l90 条件下， r 9191 的条件分布的 
5% 分位数为 

U .000 367 — 1.560 8 V 0.000 338 6 = -0.028 354. 

一个1千万美元的长期头寸的 VaR 为 


VaR = 10 000 000 x 0.028 352美元= 283 520美元. 
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这基本上与止态性假定下得到的结果相同.条件分布的1%分位数为 

0.000 367 - (3.364 O / v /^ v / O.OOO 338 6 - -0.047 594 3. 

对应的 VaR 为475 943美元.与情形1的结果比较，我们可以看出利用自由度为5 
的学生 <• 分布时的厚尾效应，当尾概率变小时增加了 VaR . 在 S - Plus 中，自由度为 
m 的学生分布的分位数可以由命令 xp=qt(p,m) 得到，例如， xp=qt(0.01,5.23). 

多个周期 

假定在/ I 时刻，我们希望计算对数收益率为 n 的资产的 fc 期 VaR . 感兴趣的 
变童是预测点处的 it 期对数收益率（即 r h [ k ) = r^ l + ... H - r h+fc ). 如果收益率 
r t 服从方程 （7.5) 和 （7.6) 中的时间序列模型.则可以通过第2章和第3章中讨论 
的预测方法来得到 r h [ fc ] 在给定信 息集八 下的条件均值与条件方差. 

1. 期望收益车与预测误差 

可以利用第2章中 ARMA 模型的预测方法来得到条件均值具体 
来讲,我们有 

fh [ k ] -- rfc ( l ) + …十 r h ( k) f 

其中 r k { l ) 是收益率在蚀测原点 / i 时的 Z 步向前预测.这些预测可以利用 2.6.4 节 
讨论的递推方法来计算.利用方程 （7.5) 中 ARMA 模型的 MA 表示 

=户 + 叫 + + V ^2 a t -2 I • • • ， 

我们可以将预测原点&处的 f 步向前预测误差定义为 

Ch(0 = Hi+f — Th(l) = tth+i + fpiah+i~i H - h fpi-iah+i. 

可参见方程 (2.33) 以及相应的预测误差 . AT 期期望收益率的预测误差是 n 
在预测原点 / i 处的1步到 it 步向前预测误差的和，可以写为 

Cfc [ fcJ = Cfc ( l ) + 办(2) + …+ e h ( k ) 

fc-i 

= a/H-l + (oh+2 + 命 ia>h 十 l) H - H ^ 

i=l 

= a /»+-fc + U + 分 i ) ah+*-i + •. • + 也) a / i + i , (7.7) 

其中办 =1 . 

2. 期望波动车 

k 期收益率在预测原点处的波动率预测是在给定匙下 Ch [ k ] 的条件方差. 
利用对 i = 1，… , k , e t + i 的独立性假定且 a t+< = at + iet + i , 我们有 
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V/iCe/jfA:]) = V^(ah+fc) 4- (1 4- ^ i ) 2 Vh { ai % + k - i ) + …+ V,’) ^ h {( ih + i ) 


= <r^(A:) + (1 +V> i ) 2 ^(A: — 1) + • • • + 4(1)， (7.8) 

其中 V h { z ) 表示 给定^ 条件下 Z 的条件方差, cr ^ l ) 是预测原点 /i 处的 f -步向前 
波动率预测如果波动率模型是方程 (7.6) 中的 GARCH 模型，那么这些波动率预 


测可以由第3章讨论的方法递推得到. 
作为说明，考虑特殊的时间序列模型 


n = ^4-o tt a t — ert£t} 

<7? = or。 十 aia^〗 十 (3\a^_ v 

则对所有的 i > Q , 有呶 = G . k 期收益率在预测原点 ft 处的点预测为 f h [ k ) = kfi , 
对应的预测误差为 

e h\^\ = + 0>h 七 k—l + …+ 叫 +i. 

因此， A ： 期收益率在预测原点 h 处的波动率预测为 

k 

V ^ enMF ^-^ crKl ). 

i=l 

利用 3 . 5 节中 GARCH ( U ) 模型的预测方法，我们有 
« rj ( l ) = a 0 4- ariaj + /3 ktJ , 

orj ⑷ = Q 0 + ( a x + f 3 x )( T 2 h {l -1), 1 = 2,…， k . (7.9) 

利用方程 （7.9), 对于洳 = 0 的情况下，我们有当 i > 0时， 

Var ( e _ 剮 = ^2(1). (7.10) 

其中 p = ai +汍< 1. 如果对某个 i > Q 有屯妾 0, 则可以利用 （7.8) 式中 
Vax ( e h \ k ]\ F h ) 的一般递推公式.如果^是高斯的，则 r h [ k ] 在给定凡下的条件分 
布是均值为方差为 Var ( e h [ k ]\ F h ) 的正态分布. VaR 计算中需要的分位数很容 
易得到 • 如果 a , 的条件分布是非高斯的（比如是学生 t - 分布或广义误差分布)，可 
以用模拟的方式得到多期的 VaR . 

例 7.3( 续）对于 IBM 股票的日对数收益率，考虑例 7.3 中的高斯 AR (2 )-GARCH 
(1,1) 模型. 假定我们感兴趣的是在预测原点9 190( 即1998年12月30曰）开始 
的 I 5 天持有期的 VaR . 我们可以通过给定^9190 T , r 9 190(15] = : ^ r 9190+< ，并 
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利用拟合的模型来计算15天对数收益率的条件均值和方差.由方程 （7.9) 递推得 
到条件均值为 0.009 98,条件方差为 0.004 794 8. 那么条件分布的5%分位数为 
0.009 98 - 1.644 9 v /0.004 794 8 = -0.103 919 1. 因此，一个 1 千万美元的多头头寸 
的 15天持有期的 VaR 为 VaR = 10 000 000 x 0.103 919 1 美元=1 03 ( J 191 美元. 
这个数值低于287 700 x #美元=1 114 257美元.由这个例子进一步表明，风险 
度量制使用的平方根时间序列法则仅仅对运用特殊的白噪声 IGARCH ( U ) 模型成 
立.当条件均倌不为0时，必须采取恰当的步骤计算 A : 持有期的 VaR . 

7.4 分位数估计 


分位数估计提供了 VaR 计算的非参数方法.除了假定该分布在预测阶段仍然 
成立以外,它不对组合的收益率作具体的分布假定.目前有两种类型的分位数 方法: 
第一种方法是直接利用经验分 位数； 第一种方法是运用分位数回归. 

7.4.1 分位数与次序统计置 

假定收益率的分布在预测期间与样本期间是一样的.可以利用收益率 r t 的经 
验分位数来计算 VaR . 令 r l5 .-., r n 表示 样本期间内组合的收益率.样本的 次序统 
计量 是这些值用递增次序排列后的值.我们利用记号 


f ( i ) ^ ^(2) 彡…《 r( n ) 

表示这个排列 ， m r ( i ) 称为样本的第 i 个次序统计量.特别地， r ⑴表示样本极小 
值，表示样本极大倌. 

假定收益率是独立同分布并有一个连续分布的随机变量，其分布密度函数 ( pdf ) 
为/ ㈤ ， cdf 为 F ( x ). 那么由统计文献（例如 Cox 和 Hinkley , 1994,见附录2)，对次 
序统计量 r w ， 其中/ 一 n P , 0 < p < 1. 我们有下面的渐近结果. 

结果令:表示 F ⑷的 p 分位数[即 r p = F -»]. 假定分布密度函数 /( a :) 
在外 处不等于0[即 f ( x p ) / 0] ,则次序统计量 r ⑴是渐近正态的，且均值为％、 
方差为 p(l - p )/[ nf a ( x p )]. 也就是说 



P ( l - P )' 
n[f{x p )}\ 


I = Tip. 


(7.11) 


根据前面的结果，可以利用来估计分位数 x p ， 这里 i = np . 实际中，感兴 
趣的概率 p 可能并不满足 np 是一个正整数.在这种情况下，可以利用简单的插值 
来得到分位数估计.更具体地，对非整数〃 p , 令和表示与 n P 最邻近的两个正 
整数,满足 h < np < l 2 . 并定义 P< = U/n. 前面的结果证明了 是分位数&的 
一个相合估计.由定义, Pi<P<P2, 因此，分位数可以通过下式 估计： 






例 T . 4 考虑英特尔股票从 1972 年 12 月 15 日至 1997 年 12 月 31 日的曰对数收 
益率，共有 6 329 个观测值.可以得到数据 5% 的经验分位数为 


io.05 = 0.55r( 3 i6) + 0.45r(3i7) = -4.229%, 

这里 up = 6 329 x 0.05 = 316. 4 5,且 r * w 表不样本的笫 i 个次序统计量.在这个特 
例中， r (3 i6 ) = -4.237%, r (3 , 7 ) = -4.220%.这里我们利用了经验分布的左尾 （lower 
tail ), 囚为它在 VaR 的计算中与持有一个多头头寸有关. 

例 7 .5 再考虑 1 J 3 M 股票从1962年7月3日至1998年12月31日的日对数收益 
率.利用全部的9 190个观测值，可以得到5%的经验分位数为 （ r (459) + r (460) )/2 = 
一 0.021 603,其中 r ( i ) 为第 i 个次序统计量，而且 np = 9 190 x 0.05 = 459.5. 1千万 
美元的多头头寸的 VaR 为216 030美元.这远远小于前面用计量方法得到的结果. 
因为样本大小为9 190,我们有91 < 9 190 x 0.01 < 92,令仍= 91/9 190 = 0.009 9, 
p 2 = 92/9 190 = 0.01() 01,则得到1%的经验分位数为 


P2 - 0.01 0.01 - pi 

^^T r<9 ” + '^r^r r(92 > 


0.000 11 
-3.657. 


(-3.658) 


(-3.657) 


这个多头头寸的1%的1天持有期的 VaK 为365 709美兀.此值又一次低于了前 
面其他方法得到的结果. 

讨论利用上囪的 VaR 计算的分位数方法有几个优势,包括 （ a ) 简单性； （ b) 没有 
具体的分布假定.然而，这个方法也有几个缺点.第一，它假定收益率 n 的分布从 
样本期间到预测期间是保持不变的.并假设 VaR 主要关心的是尾概率，则这个假 
设蕴含了预测的损失不能高于历史的损失，然而实际中并不是这样的.第二，对极 
端分位数（即当 p 接近于 () 或1时)，经验分位数并非是理论分位数的有效估计.第 
三， 直接的分位数估计无法考虑与所研究的组合相关的解释变量的影响.在实际应 
用中，由经验分位数得到的 VaR 可以充当实际 VaR 的一个下界 

7.4.2 分位数回归 

在实际应用中，人们经常能够得到对所研究问题的非常重要的解释变量.例如, 
美国联邦储备银行对利率采取的行动对美国股票的收益率具有重要的影响.从而考 
虑分布函数 r t +1 16( 这里巧 包含了这个解释变量）更加恰当.换句话说，我们对给 
定巧下 r t +1 的分布函数感兴趣.这样一个分位数在文献中常称之为 回归分 位教. 
具体可以参见 Koenker 和 Bassett(1978). 

为了理解回归分位数.将前一小节中的经验分位数看作一个估计问题是有益 
的.对于一个给定的概率 a { tv } 的 p - 分位数可以通过下式得到 
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x p = argnun ^ w p (n - ()), 

其中 w p ( z ) 定义为 

f pz , 若2 > 0， 

^ )= \ ( P -1 ),, 若 2 <0. 

回归分位数就是这样一个估计的一般化. 

为了看出这种一般化，假定我们有线性回归 

r t = (3 'xt 4- Oi , (7.13) 

其屮0是 fc 维参数向量 . ％是预测向量，这里的预测向量是的 元素. 因为 
fi f x t 是已知的，所以 r t 在给定 F t . t 条件下的条件分布就是的分布的一个平移. 
用此方式看待这个问题. Koenker 和 Bassett (1978) 指出 r t 在给定 F t - i 条件下的 
条件分位数 Xp | F t _! 的估计为 

x p \ F t -i = inf {/3 o *|/2 p (/3 0 ) = min }, (7.14) 

其中 u / lp (/9 0 ) = mln " 意思是卢 0 可以由下式得到 

n 

00 = fLTgmm^2 w p(rt - ^xt), 

其中 w p (-) 如前面定义.得到这样一个估计的分位数的计算机程序可以在 Koenker 
和 D’Orey (1987) 中找到. 

7.5 极值理论 

本节将回顾统计文献中的一些极值理论.用 n 表示某资产以一个给定时间间 
隔（如天）测量的收益率.考虑 n 个收益率的集合 { n ， … , r „}. 该集合中的最小收 
益率为也就是最小次序统 计量； 而最大收益率 r w , 也就是最大次序统计量. 
具体来讲， r (1 ) = Tnirn ^^ nh }, r („) =而《 1<1?< „{7^}.闵为对于一个多头头寸而 
言，最小收益率 r ⑴与 VaR 的计算是高度相关的.所以我们主要讨论 r ⑴的性质 - 
然而，所讨论的理论对该资产在给定时间间隔上的最大收益率也是适用的，因为最 
大收益率的性质可以通过最小收益率的一个简单的符号变化得到.具体来讲，我们 
有 = - niini ^ J ^ T1 { Tj) = 其中 rf = -r t ， 上标 c 表不符号的变化.最大 

收益率与持有一个空头金融头寸有关. 

7.5.1 极值理论的回顾 

假设收益率 7*, 是序列独立的，其通常的 cdf 为 F ( x ) 且收益率 r t 的变化 : 范围 
为 [/, u ]. 对于对数收益率，我们有/ = — oo , u = oo . r ⑴的 cdf (用 F n , i ( i ) 表不）由 
下式给出 
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P«,i ⑷ -Pr[r ⑴ ^ x] - 1 - Pr[r ( i) > x] 

=1 - Pr(ri > x,r 2 > x, - • • ,r n > x) 

n 

=i - n pr ( r i > 怎）（由独立性） 

n 

=1- fj (1 - Pr(r 7 ^ x)] 
j=i 

= i - nii - f { x )] (由通常的分布） 

=1-[1-^)]". (7.15) 


在实际中， n 的累积密度分布 F ( x ) 是未知的.因此，7•⑴的累积密度分布 F n < 1 ( x ) 
也是未知的.然而，当 n 趋于无穷时， F nA { x ) 变成退化的.即当 n 趋于无穷时， 
若 : r < /，则 F Utl { x ) — 0;若 x > 则 F Uil { x ) - 1. 因为这个退化的 cdf 没有实 
际 价值. 所以极值理论关心的是寻找两个序列和 { ari } (其中> 0)，满足 
r {1 . j ^( r (1) -/3 n )/ a n 的分布当 n 趋子无穷时收敛到一个非退化分布.序列是 
一个位置序列， {«„} 是尺庋因了序列.在独立性假定下，标准化的最小收益率7* (1<1) 
的极限分布为 


1 - exp[—(1 4- A;x) l / fc ], 
1 — exp[—exp(i)], 


若 /e 一 0, 
若 A ： = 0. 


(7.10) 


若 fc <0, 则上式对 x <- l/k 成立； 若 A ： ;> 0,则上式对 x > - l/k 成立，其中下标 * 
表示最小收 益率. A: = 0 的情况看作为 k — 0 时的极限.参数 it 称为形 状参数 .它 
控制了极限分布的尾行为.参数 rv = - l / k 称为分布的尾 指数 . 

力程 (7.16) 的极限分布是 Jenkinson (1955) 对最小收益率的 一般极值分布 .它 
包含了 Gnedenko (1943) 中三种类型的极限分布. 

• 类型 1 A: = 0, Gumbel 族，其 cdf 为 


F*(x) = 1 cxp[ exp(a:)], —oo < x < oo. 

• 类型 II fc < 0, FWchet 族，其 cdf 为 


F .( x ) 



cxp[ (1 + fcx) 1 /* 5 ], 


若 : c < -1/ A :， 
若 i 多 — l / k . 


• 类型 [II A: > 0, Wcibull (威布尔）族,这里其 cdf 为 


F.(x) = 


{ 


1 — oxp [ (1 I kx ) l ^ k ], 

0, 


若 a : > - l / k , 
若 a ： < _ X / k . 


(7.17) 


(7.18) 
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Gnodenko (1943) 给出了与上面的三种类型极限分布之一相联系的 r t 的 cdf 
的充要条件.简要地讲， F ( x ) 的尾行为决定了最小收益率的极限分布与 
Gurnbel 族相联系的分布的（左）尾是指数衰 减的； 与 FV ^ chet 族相联系的分布的 
(左）尾是-个幂 函数； 与 WeibuU 族相联系的分布的下端点是有限的（图 7-2) .对 
于极值理论的全面【寸论，读者可以参阅 Embrechts > Kuppelberg 和 Mikosch (1997). 
在风险管理中，我们主要对 Frechet 族感兴趣.它包含了平稳分布和学生分布. 
Gurnbel 族包含了如正态分布、刘数正态分布等薄尾分布.方程 (7.16) 的一般极限 
分布的概率分布密度函数 ( pdf ) 可以很容易地通过差分 得到： 


/•(a?) = 


(1 + fear ) V *- 1 exp [一 (1 
exp[ar — exp ( x )]. 


若 A : 〆 Cl , 
若 A : = 0, 


其中对 A: = 0, 一 oo <x<oo; 对 A: < 0, a: < -1/A:; 对 Ar > 0, a: > —1/A:. 


(7-19) 



图 7-2 最小收益率的极值分布的概率密度 函数： 实线是 Gurnbel 分布； 点虚 
线是 fc = 0.5 的 Wcibull 分布；虚线是 A : = -0.9 的 Frechet 分布 

前面提到的极值理论有两个重要的应用.笫一，的累积密度函数 F ( x ) 的尾 
部行为（而不是具体的分布 :1 决定了（标准化的）最小收益率的极限分布这 
样，此理论对于收益率7^的一个广泛的分布范围都是实际可行的.然而序列 { p n } 
和 {«„} 可能依赖于累积密度函数 F ( x ). 第二 ， Feller (1971, P . 279) 证明了尾指数 
k 并不依赖于 r t 的时间间隔.也就是说，尾指数（或等价地称为形状参数）在时间 
累枳 F 是不变的.极限分布的第二个性质在 VaR 计算中变得可以利用了. 

极值理论已经扩展到序列相关的观测值 { r t }? =1 , 这里假定这种相关是很弱的. 
Berman (1964) 证明了假定 n 的自相关函数是平方可积的（即 E P ? < ^其中 

A 是 n 的延迟 a 的自相关函数.则极限极值分布的同样形式对_“的正态序列也 
成立.关于序列相关性对极值理论的影响的进一步结果，读者可以参考 Leadbetter , 
Lindgren 和 Rootz^n (1983,第3章)- 
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极值分布包含3个 参数： A :， /?„， 《 n . 这些参数分别称为形状参数、位置参数和 
尺度参数.它们可以利用参数或非参数方法来估计.下面我们回顾一些估计方法. 

对于给定的样本，只有一个单一的最小收益率或最大收益率，并且我们仅用 
个极端观测并不能估汁这三个参数，因此必须利用另外的方法.文献中运用的一个 
想法就是将样本分成子样，并对子样应用极值理论.假定共有 r 个收益率 { rj ) j =1 . 
我们将样本分成个互不相交的子样，且每个子样有 n 个观测值.为了简便，假定 
T = ng . 换句话说,我们将数据分为 

( r ir** … ， r 2 nk 2 n+l ， … ,^ 3 n| … |r ( 卜 ” „ +1 .， ... ,r n0 } ? 

并将观测到的收益率记为，其中 = 注意到每个子样 

对应 r 数据区间的个子区间.当 n 充分大时，我们希望极值理论对每个于样都适 
用.在应用中， n 的选择由实际情况来决定.例如，对于日收益率， n = 21近似对应 
于一个月内的交易日 数量 : n = 63 表示一个季度夂易日的数量. 

令 r „,, 表示第 i 个子样的最小值（即 tv , 指第 i 个子样中的最小收益率)，其 
中卜标 n 用来表示子样的大小.当 n 充分大时，杯.< = (r nii -/?„)/«.„ 应该服从一 
个极值分布，并且子样最小值的集合 {r nti \i = I ,--- , 5 } 可以认为是从极值分布中 
抽取的 S 个观测值的样本.具体来讲,我们定义 

{r (i _ 1)M+J }, i = 1, ... ，分 . (7.20) 

子样最小值的集合 { tv ,} 是我们用来估计极值分布未知参数的数据.显然，得到的 
估计可能依赖于子区间长度 w 的选择. 

1. 参数方法 

有两种参数方法可以利用 最大似然法和回归方法. 

2. 最大似然法 

假定子区间最小值 { r n<i } 服从一般的极值分布，满足而= (7 W - 凡)/%的 
pdf 由方程 (7.19) 给出，我们可以通过简单的转换得到的 pdf 为 


f{r n ,i) = 

[^'an Pn ] } ’ 若、 = 0 ， 

其中，若_ 0 ,则1十 — ( 3 n )/ a n > 0. 形状参数 A ： 中加入下标 n , 表示它的 
佔计依赖于 n 的选择.在独立性假定下，于区间最小值的似然凼数为 

9 

’ ( r n 山 • • • ， /(^n,f)* 


Mr n ， 广關 1 〜一】 


exp<- 1 + 


，若 / c n 一 0, 
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可以利用非线性估计程序来得到心，札和的最大似然估计.这些估计是无偏 
的、渐近正态的，且在适当的假设下具有最小方差.详细情况可参见 Embrechts 等 
(1997) 和 Coles (2001). 稍后我们对一些股票收益率序列应用这些方法. 

3. 回归方法 


此方法假定 { r n > i }? =1 是从方程 （7.16) 的般极值分布中抽取的个随机样本. 
并且利用了次序统讣量的性质.参见 Gumbel (1958). 将子区间最小值的 
次序统计量表示为 


Ml ) 彡 r »* ⑵ $ …< r n ( ff ). 

利用次序统计童的性质（例如 Cox 和 Hlnkley , 1974, P . 467), 我们有 

£ {尸4〜(<)1} = *• = 1，… (7.21) 

为了简便. 我们根据 A : 的值分为两种情形讨论.首先，考虑 A : # 0的情形.由方稈 
(7.16), 我们有 




- exp 


1 + fcn 


r n(i) -M l/kn 




(7.22) 


因此，利用方程 (7.21) 和方程 (7.22) 以及观测值的渐近期望，我们有 


1 — exp 




因此， 


{- 卜 H 


连续两次取自然对数，前面的方程给出 


exp 


ff + l 


1， . . . ，.9, 


& 卜 士 I 

令表示前面两个量之 

涉骤 

+ 


1 +h 


r n (i) - 0n 


以 ft 




1， 


实际中，令 ^ 表示前面两个量之间的偏移,并假设不是序列相关的，则我们有 
一个回归步骤 

fcn~— ~ ~ +Ci, i=l ，".，： 

«n j 

可以通过最小化 q 的平方和来得到/?„与的最小二乘估计. 

当心= 0时，回归的建立简化为 


(7.23) 


k [' 111 (^TTT 1 )] = + f = H 

最小二乘估计是相合的，但比最大似然估计的有效性低.本章将利用最大似然估计. 
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4. 非参數方法 

形状参数 fc 町以利用一些非参数方法来估计.这里我们将讨论两种这样的方 
法.这两种方法是由 HU 1 (1975) 和 Pickancls (1975) 提出的.分别称之为 Hill 估计 
和 Pickands 估计.将两种估计都直接应用到收益率上.因此就没有必要考 
虑子样了.将样本的次序统计量表示为 


r ( l ) 彡 r (2) 彡…彡 r (< r )， 


令 g 为一个正整数，则的两个估计定义为 


k P {q) 


R2) 


In 


~ r (i) 4 - r (2g) 
~ r (2g) + r (4q ). 


(7-24) 


—1 

k h ( q ) = — ^2 [- r ( i >】— W — qg + i )】}， （7.25) 

H i=l 

其中变量⑷用来强调此估计依赖于 ( 7 . Hill 估计和 Pickands 估计之间的 g 的选 
择是不同的.几个研究者己经调査过 v 的选择问题.但是还没有得到一般的对于 
可以利用的最好选择的结论 Dekkers 和 Df Haan (1989) 证明：对样本容量 T ， 如 
果 9 在一个恰当的选抻间隔上是增加的，则 k p { q ) 是相合的.另外，他们还证明了 
y / q [ kp { q )- k ] 是渐近正态的，且均值为 U 、 方差为 A ; 2 (2- 2fc+1 f l )/[2(2- fc - l ) ln (2)] 2 . 
Hill 估计仅仅对 FVcchet 族是适用的，但当它适用时，它比 Pickands 估计更有效. 
Goldie 和 Smith (1987) 证明 y / q [ k h { q ) - A ;] 是渐近正态的，且均值为 U 、 方差为人 - 2 . 
实际中，可以画出 H1U 估讣 ⑷对7 的图形，并且寻找一个恰当的 <7使得估计是 
稳定的.可以用估计的 M 指数《 = - i / k h { q ) 来得到收益率序列的极值分位数.参 
见 Zivot 和 Wang (2 UU 3). 


7.5.3 对股票收益率的应用 


我们对 IBM 股票从1962年7月3日至1998年12月31日的日对数收益率 
应用极值理论.收益率用百分比测量，且样本量为9 190( 即 r = 9 190) .图 7-3 显 
示了当了区间的长度为21灭时，极端日对数收益率的时间图形，这近似对应于一 
个月.从图中可以清楚地看到1987年10月的股市崩盘.排除1987年的股巾崩盘, 
极端日对数收益率的范围是1).5%到13%. 

表 7-1 概括了由 Hill 估计得到的形状参数为 fc 的一些估计结果.此表显不对 
所给的 g 的二种选择，结果都是稳定的.为/对 Hill 估计的表现提供一个全面的概 
况，图 7-4 显示了 Hill 估计对<?的离散图.对正的和负的极端日对数收益率. 
除了 V 很小的情形，估计都是稳 定的. 估计的形状参数大约是-0.30,在渐近5%水 
平下其显著地不同于 0. 图形也说明了对于负极端值，形状参数看上去很小，隐 
含了日对数收益率可能有一个更厚的左尾.总之，结果说明 IBM 股票的日对数收 
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( a ) 月最大对数收益率 



1970 1980 1990 2000 

年 

( b ) 月最小对数 收益率 



1970 1980 199() 2000 

年 

m 7-3 当子区间是21个交易日时， IBM 股票的最大与最小日对数收益率.数据区间从 
1062年7月3曰至1998年12月31日：⑷正 收益； （ b ) 负收益 

益率的分布属十 P ^ chet 族.这样，该分析拒绝，实际中通常釆用的正态性假定.这 
个结论与 Longin (1996) 是一致的，他当时利用了美国股票市场指数序列.在 S-Plus 
中，可以用命令 hill 来得到 Hill 估计,例如 

ibm.hill = hill ( ibra # option = # xi # f end =500). 

表 7-1 IBM 股票从 1962 年 7 月 3 日至 1998 年 12 月 31 日的日对数收益率 Hill 
估计的结果 a 




•/ 


图 7-4 IBM 股票日对数收益率 Hill 估计的散点图.子样区间从 1962 年 7 月 3 日至 
1998 年 12 月 31 日， （ a ) 正 收益； （ b ) 负收益 
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下面我们对 IBM 股票的日对数收益率应用最大自然法来估计一般极值分布的 
参数.对于子区间长度从1个月 （n = 21) 到1年 （n = 252) 的变化范围，表 7-2 概 
括了不同选择的估计结果.由此表，我们做出以下观测结果. 

•当 n 增加时，位置参数乂和尺度参数的估计的绝对值是递增的.这是 
可以预料的，因为子区间最小值和最大值的期望量值是 n 的不减函数. 

•当 n > 63时，形状参数（或等价于尾指数）的估计对于负的极值是稳定的, 
近似为 -0.33. 

• 形状参数的估计对正极值不那么稳定.这个估计在数量上很小，但仍显著不 
同于 0. 

•因为 n = 252的子区间 g 的长度相当小，所以其结果具有高度可变性. 

得到的这个结果又类似于 Longin (1996) 的结论，他对将极值理论应用到股票市场 
收益率的分析提供了个很好的解释. 

表 7-2 的结果是由 Richard Smith 教授所幵发的 Fortran 程序（作者做了一 
定的修改）得到的.也可以用 S - Phw 来进行上述 估计. 卜面演不在分析 +周期 
为21个交易日的最小收益率时用到的命令.注意收益率均乘以了 -100,因为 （ a ) 
S - Plus 主要讨论分布的 右尾； （ b ) 收益率以百分比的形式给出.另外， S - Plus 中的 
Cxi , sigma , mu ) 分别对应表中的.由 S - Plus 得到的估计与表 7-2 中 
的很接近. 

表 7-2 对 IBM 股果从1962年7月3日至1998年12月31日 


的日对数收益率极值分布的最大似然估计》 


了区 间 1 C 度 

尺度 

位罝知 

形状参数 


垴小收益 


1 个月 ( n =21, 5=437) 

0.823(0.035) 

-1.902(0.044) 

-0.197(0.036) 

1 季度 （ n =63, S =145) 

0.945(0.077) 

-2.583(0.090) 

-0.335(0.076) 

6个月 ( n =126, g = 72 ) 

1.147(0.131) 

-3,141(0.153) 

-0.330(0.101) 

1 年 ( n =252, j /=36) 

1.542(0.242) 

-3.761(0.285) 

-0.322(0.127) 


最大收益 


1 个月 （ n =21, s =437) 

0.931(0.039) 

2.184(0.050) 

-0.168(0.036) 

1 季度 ( n =63, g =145) 

1.157(0.087) 

3.012(0.108) 

-0.217(0.066) 

6 个 H ( n =126, ff =72) 

1.292(0.158) 

3.471(0.181) 

-0.349(0.130) 

1 年 （ n 二252, y = 3 G ) 

1.624(0.271) 

4.475(0.325) 

-0.264(0.186) 

a 括号内的数值为标准保差. 


GEV 估计的 S-Plus 演示 

收益率序列是 ibm . 

> length ( ibm ) 

[1] 9190 
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>grp®floor(9190/21) 

>PT> 

[1] 437 

>for(i in l:grp){ 
+jend=9190-(i-l)^21 


♦jst=jend-21+1 

+xmin [i] *min (ibm[j st: j end]) 

>y*xmin«(-100) 

>nibm.gev•21=gev(y) 

>namesCnlbm.gev.21) 

[1] M n.all M M n M "call" "block “ H data M 

[6] "par.eats" "par.sea" "varcov" M converged" "nllh,final" 

>nibm.gov.21$par.osta 

xi sigma mu 

0.1953325 0.8187631 1.921797 


>nibm.gev.21$par.ses 


xi si 

0.03539358 0.03^ 


gmA mu. 

456347 0.043 


87343 


>plot(nibm.gev•21) 


Make a plot selection (or 0 to exit) : 
1: plot : Scatterplot of Residuals 
2: plot: QQplot of Residuals 
Selection: 



图 7-5 给 IBM 股票的负的日对数收益率拟合 GEV 分布时的残差图.数据的时间区间 
是从1962年7月3曰到1998年12月31日.数据以百分比形式给出，且子区 
间长度是21个交易日 






定义所拟合的 GEV 分布的残差是 
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广. 

利用 GEV 分布的概率密度函数以及变量的变换，可以很容易 证明： 如果所拟合的 
模型是正确的，则{叫}应该是一列独立同指数分布的随机变量.图 7-5 显示了给 
IBM 股票的负的日对数收益率拟合 GEV 分布时的残差图，子周期长度是21个交 
易日.左边的图给出了残差，右边的图给出了对指数分布的 QQ 图，图像表明拟合 
是合理的. 

7.6 VaR 的极值方法 

本节将讨论利用极值理论的 VaR 计算方法.该方法类似于 Longin (1999 a , 
1999 b ), 他出于同样的目的提出了一个八步程序.我们将讨论分为两个部分.第一 
个部分关心的是利用 7 .5节讨论的方法得到的参数 估计; 第二个部分通过将感兴趣 
的概率与不同的时间区间相联系，集中讨论 VaR 计算. 

第一部分 

假设样本区间上可以利用的资产收益率有 r 个观测值.我们将样本区间分解 
为9 个互不相交的长度为《的子区间，满足 r = 呵.如果 r =叩 + m ， 1彡 m < 71， 
那么我们将前 m 个观测值从样本中删除_ 7.5 节中讨论的极值理论使我们能够得到 
对子区间的最小值 { r n ,,} 的位置参数义、尺度参数以及形状参数匕的估计. 
将最大似然估计代入方程 （7.16) 的 cdf , 其中， x =( r -/? n )/ a n , 则我们可以得到一 
般极值分布在给定概率下的分位数.因为我们集中于讨论持有多头金融头寸,所以 
感兴趣的是下（或左）分位数.令 〆 为一个小概率.它表示一个多头头寸的潜在损 
失超过一定限度的可能性，且 r ；； 为子区间最小值在极限为一般极值分布条件下的 
P *- 分位数，则我们有 

[ 1 - exp [-exp 队 )] ， 若 fc „ = 0. 

这里可以理解为，对于 fc „ 笋0,有1 + fc „(< - p n )/ a n > 0. 将这个方程改写为 


In(l-p-) 
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我们得到分位数为 

( 凡 - 〆 )]&}，若 k n ^0, 

< =< ^ (7.26) 

I +知 ln [— ln(l — p *) j ， 若 k n = 0. 

在金融应用中，主要感兴趣的就是 A ;„ _ 0的情形. 

第二部分 

对于一个给定的下尾（或左尾）概 率 〆 ， 方程 (7.26) 的分位数 r ；； 就是在对子 
区间最小值的极值理论基础上计算的 VaR . 下一步就是制定子区间最小值与观测 
的收益率序列之间的明确关系. 

因为大部分资产收益率或者是序列无关的.或者有很弱的序列相关件，所以我 
们可以利用方稈 (7.15) 的关系.得到 


或等价地 


P* = P(r„^r；) = l-[l-P(r^<)r 


l-p* = [l-P(r^r；)]«. (7.27) 

概字之间的这种关系允许我们得到原始的资产收益率序列的 VaR . 更精确地讲, 
对于一个特定的很小的下尾概率 P ， 如果 〆 是根据方程 （7.27) 选择的，则 n 的 P 
分位数是其中 p = P(r t ^ r *). 因此，对给定的小概率 p ， 持有一个对数收益率 
为 r t 的标的资产，其多头头寸的 VaR 为 

f [- nln(l - p)] kn } ,若 / 0， 

VaR = { ^ (7.28) 

[ 0 n -f an ln[-nln(l -p)J, 若 kn =0, 

其中 n 是子区间的长度. 

小结 

我们将应用传统的极倌理论来计算 VaR 的方法概括 如下： 

(1) 选择子区间的长度 n , 并得到子区间的最小值 {r n<i }, i = 1，...，％这里 
9 = [T/n]) 

(2) 得到乂 ，〜和的最大似然 估计； 

(3) 检査拟合的极值模型的充分性，可参见下一节中模型检验的一些 方法； 

(4) 如果极值模型是充分的，则可应用方程 （7.28) 计算 VaR . 

注释： 囚为我们集中于讨论持有一个多头金融头寸，即讨论收益率分布的左 
尾分位數.囚此，分位數是 负的. 然而.实际中习惯于利用一个正数来计算 VaR , 这 
样，在利用方程 （7.28) 时，应该意识到负号代表一个损失. □ 
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例 7.6 考虑 IBM 股票从 1962 年 7 月 7 曰至 1998 年 12 月 31 曰，以百分比表示 
的闩对数收益-由表 7-2, 对 r> 63, 我们有 = 0.945, 0 n = 2.583, k n = 0.335. 

因此，对左尾概率 p = 0.01, 相应的 VaR 为 

VaR = -2.583 - {l - [-631 n ( l - 0.01)]~°- 335 } 

— U.o«5u 

= -3.049 69. 

这样，对于股栗的日收益率， 1% 分位数是 -3.049 G9. 如果某人持有这只股票价值 1 
千万美元的一个多头头寸，則概率 1% 的 VaR 估计为 10 000 000x0.03() 496 9 美元= 
304 969 美元.如果概率是 0.05, 则相应的 VaR 为 166 641 美元. 

如果我们选择 n =21( 即近似于1个月)，那么= 0.823,义=-1.902, 
fcn = -0.197, 极值分布的 1% 分位数为 
0 82*? 

VaR - -1.902 - ■ 二。 197 (^~ - 0.01)] -0 197 } = —3.400 13. 

所以，对于一个1千万美元的多头头寸，在1%风险水平上对应的1天持有期的 VaR 
为3如013 美元. 如果概率是 0.05, 则对应的 VaR 为184 127美元.在这个特殊的 
情形， n -21 的选择给出了更高的 VaR 值. 

例 7 . G 中用极值理论得到的 VaR 值小于例 7.3 中用 GARCH (1，1) 模型得到的 
VaR 值，这一点有些 奇怪. 事实上，例7\6屮的 VaR 值甚至小于例 7.5 中根据经验 
分位数得到的 VaR 值.出现这种情况的部分原因是由于概率为 0.05 的选择.如果 
某人选取概率为0.001=0.1% ,并考虑间样的金融头寸，那么我们有 n = 21时，对 
髙斯 AR (2)- GARCH (1,1) 模型， VaR =546 641 美元; 对于极值理论有 VaR =666 590 
美元. 而且，这里通过传统的极值理论得到的 VaR 可能并不充分，因为统计检验经 
常拒绝了日对数收益率的独立性假定.最后，子区间最小值的应用忽视了日对数收 
益率中波动率聚类的事实 . 7 . 7 节将要讨论的极值理论的新方法克服了这些缺点. 

注释：例 7.6 中的结果显示，根据传统的极值理论计算的 VaR 依赖于 n . 的 
选择，其中 n 表示子区间的长度.因为极限的极值分布成立，所以应该选择一个大 
n. 但是当样 本量了 固定时，一个大 n 意味着一个小仏其中 g 为估计三个参數 
和 时运用的有效样 本量. 因此，需要在 n 与没的选择中作一些 妥协. 应根据 
所研究资产的收益車给出一个恰当的选择 • 我们建议在运用传统的极值理论时，应 
该检验结果中 VaR 的稳定性 n 


7.6.1 讨论 

巧们已经对一个1千万美元的多头头寸中的 IBM 股票日对数收益率的 VaR 
计算运用了各种不同的方法.考虑下一个交易日头寸的 VaR . 如果概率是5%,这 
意味着在下一个交易日中，损失将以概率95%低于或等于 VaR , 则得到的结 果为： 
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(1) 对于风险度量制•为302 500 美元； 

(2) 对高斯 AR (2)- GARCH (1.1) 模型为 287 200美元•， 

(3) 对自由度为 5 的标准化学生 t 分布的 AR (2) GARCH (1,1) 模型，为 
283 520 美元； 

(4) 对运用经验分位数时，为 21 G 030 美元； 

(5) 对利用月最小值（即子区间长度 n=21) 并运用传统的极值理论方法时，为 
184 127 美元. 

如果概率为1%,则 VaR 为 

(1) 对于风险度量制.为 4 M S00 美元； 

(2) 对高斯 AR (2)- GARCH (1,1) 模型，为409 了38 美元； 

(3) 对自由度为5的标准化学生分布的 AR (2)- GARCH (1,1) 模型，为 
475 943美元； 

(4) 对运用经验分位数时，为365 709美元. 

(5) 对利用月最小值（即子区间长度 n =2 l ) 并运用传统的极值理论方法时，为 
340 013 美元. 

如果概率为0.1%,则 VaR 交为 

(1) 对于风险度量制，为 56 e 443 美元； 

(2) 对卨斯 AR ,(2)- GAHCH (1,1) 模型，为 5 牝 ( Ml 美元； 

(3) 对自由度为5的标准化学生 t - 分布的 AR (2)- GARCH (1,1) 模型，为 
836 341 美元； 

(4) 对运用经验分位数时，为 TOO 美元. 

(5) 对利用月最小值（即子区间长度 n =21) 并运用传统的极值理论方法时，为 
666 590美元. 

不同方法间有着不小的区别.这并不令人惊奇，因为在估计统计分布的尾行为 
时存在较大的不确定性.由于没有真实的可以得到的 VaR 来比较不同方法的精度， 
我们建议运用几种方法来获得 VaR 的一个范围. 

尾概率的选择在 VaR 计算中也起着重要的作用.对于 IBM 股栗的日收益率, 
因为样本量为9 190,使得5%和1%的经验分位数都是收益率分布的分位数的适当 
估讣，在这种情形下，我们可以将基丁经验分位数的估 II 结果当作真实 VaR 的一个 
保守估(即一个下界).以这个观点，对 IBM 股票的日对数收益率而言，基于传统 
极值理论的方法看上去低估了 VaR . 下一节将要讨论的条件极值理论的方法就克 
服了这个缺点. 

当尾概率很小（例如0.1%)时，经验分位数是真实分位数的一个不太合理的估 
计.基于经验分位数的 VaR 小能冉充当真实 VaR 的一个卜界.最后，前曲的结果 
很清楚地说明当尾概率很小时，在 VaR 计算中运用了厚尾分布的效应.在概率为 
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().1%时，基于自由度为5的学生分布的 VaR 或基于极值分布的 VaR 都高于基 
于正态假定下的 VaR . 

7.6.2 多期 VaR 

风险度量制方法的时间平方根法则变成了运用极值理论时的一个特殊情形 . / 
天持有期与1天持有期之间的关系为 


VaR(Z) = —VaR - r fc VaR ， 

其中 a 是尾指数， fc 是极值分布的形状参数.具体可参见 Danielsson 和 de Vries 
(1997 a ). 这个关系称为时间〜根法则，这里 o = I . 且不是尺度参数％,. 

为了解释，考虑例 7 .6巾 IBM 股票的日对数收 益率. 如果我们用 p = 0.05 以 
及 n - 21的结果，则对30天持有期，我们有 

VaR (30) = (30)° 335 VaR = 3.125 x 184 127美元= 575 397美元， 

因为 i ° 335 < I 0 5 , 则时间 《- 根法则产生了比时间平力根法则更低的 i 天持有期的 
VaR . 


7.6.3 空头头寸的 VaR 

本小节将给出持有一个空头头寸的 VaR 计算公式.这里感兴趣的是子区间的 
最大值，并且极限的极值分布变为 


兄 ( r ) 


exp 


kn(r~(3n) 

Oi u 


H 

卜閉] ， 


n. 


若 fc n 一 0, 
若 = 0, 


(7.29) 


其中 r 表示子区间的最大值.这里对心/ 0,可以理解为有1 - fc„(r - Pn)/a n > 0. 
与多头头寸的程序炎似,我们得到收益率的 （1 -p)- 分位数为 

( + TT I 1 ~ [- - P )]*" } 1 若* n _0, 

VaR = / ^ 1 - * 

[/? n + a n ln 【- r » ln ( l - p )】， 若 = 0， 

其中 p 是一个小概率，表示持有一个空头头寸时损失的机会 . n 是子区间的长度. 

7.6.4 收益率水平 


(7.30) 


基于子区间极值理论的另外一个风险度量是收益率水平 . g 个长度为„的子 
区间的收益率水平定义为这样一个 水平： 该长度为 n 的子区间中有1/0个超 
过了该水平.即 


< ^n,g) — g> 
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其中表示子区间的最小值.收益率水平所超过的那个子区间称为重点区间 
(stress period ). 如果子样本区间足够大使得标准化后的 ir„,i 服从 GEV 分布，则 
收益率水平为 

^ n , 3 =+ "^ {[— ^(1 — — !}> 

上式中假定 I / 0. 注意，这是由 (7.26) 式所给出的极值分布的精确分位数，尾概 
率为 P * = 1/ A 它们只是在书写的形式上有所不同.因此，收益率水平是应用到子 
区间的最小值（或最大值）而不是标的收益率本身.这也正是 VaR 与收益率水平的 
区别所在. 

对于子区间长度为21天的 IBM 股票的负的日对数收益率，我们可以用所拟 
合的模型得到12个这种子区间 ( HP , = 12) 的收益率水平为-4.4835%. 

计算收益率水平的 S - Plua 命令 

> rl.21.12»rlevel.gev(nibm.gev.21, k.blocks=12 # 

♦ type="profile") 

> class(rl.21.12) 

【 1 】 ••list" 

> names(rl.21.12) 

【 1] "Range" "rlevel w 

> rl.21.12$rlevel 
[1] 4.483506 

在 S-Plus 中，子区间的数量由 k . blocks 表示，子命令 type =' profile * 产生收 
益率水平对数似然置信区间的概图.该图并没有在这里给出.类型的另外一个子命 
令是 type = * RetLevel \ 

如果用子区间的最大值，则收益率水平定义为 P ( r n<i > L n>g ) = l / 9 l 其中 tvm 
表示子区间的最大值.同样,最大值利用 GEV 分布，我们得到 

Ln,g = 十 ^ 一 [— — / 5 )]*"}| 

其中 5 为子区间的数量. 

7.7 基于极值理论的一个新方法 

前面提到的利用极值理论计算 VaR 的方法遇到了一些困难.首先，子区间长 
度 n 的选择并没有给出清楚的定义.其次，该方法是无条件的，从而没有考虑其他 
解释变量的影响.为了克服这些凼难，统计文献中已经提出/极值理论的现代方法. 
具体可参见 Davison 和 Smith (1990) 以及 Smith (1989). 新方法并不着重于讨论 
极值（最小值或最大值)，而是着重讨论对某个高门限的超出量和超出发生的时间. 
因此该新方法也称为超出门限的峰 (peaks over threshold ( POT )). 例如，考虑本章 
中所用到的 IBM 股票的日对数收益率，以及持有该股票的一个多头头寸. 令 V 表 
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示一个指定的高 门限. 我们可以选择77 = -2.5%.假设第7:次超越在第&天发生 
(即 h < 77 )， 则^方法集中于讨论数据 （ Ln , -7?) ，其中 r t . 为超过门限 r ； 的超 
越量.且表示第 i 次超越发生的时间.类似地，对一个空头头寸，我们可以选择 
V = 2 %,并讨论数据- ri ), 这里 > 77 . 

实际中，发生时间提供了关于重要的“稀少事件，，(如对多头头寸而言低于 
门限 //) 出现强度的有用的信息 . G 的一 * t •聚类表示了一个人的市场低迷期.超越 
量％ - T7 也很重要，因为它提供了我们感兴趣的实际量. 

根据前面的介绍，新方法并不要求对子区间长度 n 的选择，但是它要求指定一 
个门限 r /. 门限"的小同选择将导致形状参数 A : (从而尾指数 - l / k ) 的不同估计.在 
文献中，一些研究者相信 r / 的选择既是一个统计问题.又是一个金融问题，它不能 
纯粹地根据统计理论来确定.例如，不同的金融机构（或投资者）具有不同的风险 
容忍度.这样，他们即使对于相同的金融头寸也可以选择不同的门限.对于本章中 
考虑的 IBM 股票的日对数收益率,计算的 VaR 对 7 / 的选择是不敏感的. 

门限 W 的选择也依赖于观测到的对数收 益卒. 对一个稳定的收益率序列，选择 

_ 2 —5% 对多头头寸而言是相当好的 • 对一个有较大波动的收益率序列（例如网 
络股的日收益率)，7?可能低至—10%.有限的经验表明.可以通过选择％使得超越 
的次数足够大（如大约为样本总数的5%).对于选择7；的一个更加正式的研究，可 
以参见 Daniclascm 和 de Vries (1997b). 

7-7.1 统计理论 

再一次考虑资产的对数收益率 rt . 假定第 i 个超越在^时刻发生.集中讨论超 
越量7/和超越时刻将导致统计想法的重要变化，新方法并不使用边际分布 
(如最小值或最大值的极限分布)，而是采用一个条件分布来处理给定观测超过一个 
门限的条件下超越量的 大小. 超过门限的机会是由概率规律控制的.换句话说，新 
方法考虑了多头头寸在给定 r< < ▽ 下 ， t n ”的条件分布.亊件 { rf < r/ } 的 
出现服从一个点过程（例如一个泊松过 程). 对泊松过程的定义可参见 ( J .9 节.具体 
地.如果过程的强度参数 A 随时间不变，则泊松过程是齐 次的； 如果 A 随时间变化 
则泊松过程是非齐次的.泊松过程的概念可以一般化到多元的情形 • 

为了表示方便，下面我们利用一个正门限以及收益率分布的右侧来讨论极值理 
论新方法背后的统计理论.这相当于持有一个空头头寸 • 然而，如果将此理论运用 
到序列 ， rf = - r t ， 则该理论对于一个多头头寸适用得也同样好.这一点很容易 
看出，因为对一个正门限 O %等价于 r t 彡 - ％这里 - v 变为一个负门限. 

新方法的基本理论是对于方程 （7.29) 中给出的最大值的极限分布考虑给定 
r > w 下 r : ar + r ； 的条件分布.因为没有必要选择子区间的长度所以我们 
不用它来表示一个参数的下标 • 给定 r > T / 条件下， + 的条件分布为 
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Pr(r < a ; + > ”）= 


Pt(tj ^ r ^ x±rj) _ Pr(r 彡 a; + r?) - Pr(r ^ rj) 


Pr(r > ”） 


(7-31) 


利用方程 (7.29) 中的累积分布函数 F • ㈠ 以及近似 e - 
之后.我们得到 


1 - Pr(r ^ 7；) 

y , 经过一些代数运算 


Pr(r ^x + rt\r >T]) 


F“x + r?) — F m {rj) 
1 -尺⑹ 


exp j 

M 

^ k { x -\- v ~ 

i / fc ] 

J 

1 -exp|- [1- 

Hv - P )] 

a 

i/fc j 



1 —exp 1 - 

Kv - p )^ 

(X 

1/fc'l 

J 

\ 


一 h 


kx 


k ( v ~ P ) 


i/fc 


(7.32) 


其中 a : > 0, 且 1 - fc ( T ； - f 3 )/a > 0. 以后将会看出，这个逼近使得新方法与传统的 
极值理论之间的连接更明确了. & = 0的情形可看作是 fe -0 的极限，从而 


Pr(r < a: + ? 7 |r > 77 ) » 1 - exp(-x/a). 


称下述累积分介函数为广义帕累托分布 （ GPD ). 


卜 _ 

'kx L / fc ' 

G* 燕 )(:)=j 

V ，(”） 

^ 1 - c 

jxp[-x/\f){ri)l 


A :/0. 


(7.33) 


其中 你) > 0,且当 fc < 0时， x > 0;当 fc > 0时，0彡 a : 《于是， (7.32) 
式的结果表明给定 r > 时 r 的条件分布可以由 GPD 很好地近似•该 UFU 的参 
数为和也⑼ = a - k { Tj - /3 ).更多的信息可参见 Embrechts 等 (1997). GPD 的 
一个重要性质如下.假定在给定门限％时 r 的超额分布为 GPD , 且其形状参数为 
fc , 刻度参数为 Mml 则对任意的门限 U >加，给定门限 W 的超额分布也是 GPD , 
并且其形状参数为 fc , 刻度参数为 rp ( v ) = - k(rj - vo )- 

当 fc = 0时， （7.33) 式的 GPD 退化为指数分布.该结果使得我们可以利用超出 
某个门限的超额收益对指数分布的 QQ 图来推断收益率的尾部行为.如果 fc 二0, 
则 QQ 图是一条直线.图 7-6 a 给出了本章所用的 IBM 股票的负的日对数收益率的 
QQ 图.这里门限为 0.025. 图像的非线性清楚地表明了 IBM 对数收益率的左尾要 
比指数分布的厚，即 *#0. 
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(») IBM 股裏的负日对数收益率 




图 7-6 从1962年7月3日到1998年12月31日的 IBM 股票的负日对数收益率的 
图像： （ a ) 门限为2.5%时超额收益率的 QQ 图； （ b ) 超额均值图 

绘制图像 P6 时所用到的 S-Plus 命令 

> par(mfcol=c(2 # 1)) 

> qplot( - ibm,threshold= 0 . 025 , 

+ main=，Negative daily IBM log returns *) 

> meplot (-ibm) 

> title(main^'Mean exceao plot *) 

7.7.2 超额均值函数 

给定一个高的门限加时，假定超额收益 r - rjo 服从参数为 fc 和 的 GPD . 
其中0 > > -1. 则超过门限加的超额均值为 

丑 ( r - 伽 | r >77 o ) = ^^. 

1 + A : 

对于任意 ”> 0 ,定义超额均值函数为 
e( V )^E(r- V \r > V ) ^ 

1 I h 

换吉之，对任意 j />0, 

c (,Vo • y) = E[r - (770 十 y)|r > 如十 y] = V ; (^o) - ky 

1 + k 

因此,对于固定的 Ar . 超额均值函数是 y = r ) - Vo 的线性函数.该结果引出了一个简 
单的绘图方法来对 GPD 推断出一个合适的门限值如.定义经验超额均值函数为 

e r ( v ) = 一 17 )， (7.34) 
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其中乂是超出 r / 的收益率的数量， r t . 是相应的收益率的值.对于记号上的更多信 
息参见下一小节.~ ⑹对 7?的散点图称为超额均值图.当 r ? > Tto 时，该图关于7? 
是线性的.阁 7-fib 给出了 IBM 股票的负日对数收益率的超额均 值图. 该图表明， 
与其他值相比而言，门限值取对负的日对数收益率是合理的.在 S-Plus 中绘制 
超额均值图的命令是 meplot 


7.7.3 极值建模 的一个 新方法 

利用方程 (7.32) 的统计结果，并且联合考虑超越量与超出时间， Smith (1989) 
提出了一个二维泊松过程来对 ( ii , r lt ) 建模. Tsay (1999) 利用这个方法来研究风险 
管理中的 VaR. 本节我们利用同样的方法. 

假定基本的时间间隔为 A 其典型的取法是1 年. 在美国，因为1年中一般有 
252 个的交易日，所以使用乃= 252. 令表示数据点的时间间隔（例如日)，并将时 
间区间表 示为* = i ， 2,... ,r, 其中 r 代表全部数据点的个数.对个给定的门限 
■ n ， 超出 N 限的超额时间用 { ti,i = h ---, N V } 来表示，在点观测到的对数收益率 
为 TV 因此，我们集中讨论对 i = h …為 建模，这里 AT ,, 依赖于门限 
V. 

运用极值理论的新方法是猜想超越时间与相关收益率[即联合形成了 
一个二维的泊松过程,其强度测度由下式给出 

A[(D 2 ,Z?!) x (r,oo)] = D ^^S{r,k,a,0), (7.35) 


其中 5( r ; fc , a ,^) = p — 中: ~ ^ ] ' ，0 < A < Aj < 7\ r > t ;, rr > 0, /?和 A : 是参 

数.记号定义为 [x] + =max(x,0). 这个强度测度说明.超越门限的出现与时间 
段 [D u D 2 ] 的长度成正比，并且此概率可以由类似于方程 (7.29) 中累积分布函数 
F,(r) 的生存函数的指数来控制.随机变量X的生存函数定义为 S ( x ) = Pr(X > 
x) = l - Pr(X <x) = 1 -cdf(x). 

当 it = 0 时，强度测度可看作 A : — 0 的极限，即 


A[(D 2 ,D,)x(r,oo)] 


£?2 一 -^1 
~ D ~ 


exp 



方程 （7.35) 中，时间间隔的长度是相对于基本区间长度£>来度量的. 

在考虑时间段 10,D] 上，给定 r > r/ 条件下， r = ar + T,(T>0) 的隐含条件概率 
时，利用方程 (7.35) 中的强度测度的思想将变得非常清楚. 


A[(0,D) x (x +r?,oo)l _ 

1 — k(x -f ?7 - P)/ct 

l/k 

[x kx 

A[(0, D) x (tj, oo)] 

l-k(r)- (3) /a . 

L a-k{r,-0)\ 
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恰是方程 (7.32) 中给出的条件分布的精确生存函数.这个生存函数是从由方程 
(7 29) 给出的最大值的极限极值分布得到的.这里我们利用了生存函数，因为它代 
表了超越所发生的概率. 

方程 (7.29) 中的极限极值分布与方程 (7.35) 中的强度测度的关系直接将极值 
理论的新方法与传统方法连接了起来. 

数学上，方程 (7.35) 的强度测度可以写为一个强度函数的积分 

(r.oo)] = J X(t,z]k,a,/3)dtdz, 

其中强度函数 A ( t ,2； A :, a ,^) 定义为 

\{ t , z \ k , a , P ) = ^ g { z \ k , a , p ), (7.36) 

其中 

钋 -W 1 , 若 ㈣ 

g(z]k, ai /3) = 

若 k = 0. 

利用泊松过程的结果,我们可以写下观测到的超越时间与相应收益率 
在二维空间 [0, iV]x ( 77 , 00 ) 上的似然函数为 

L{k,a,P) = (ff-s(7V’A:,Q^)) x exp [- 《 5(T/ ; fc’Q ： , 叫 . (7.37) 

参数 A :, q ,/3 可以通过最大化这个似然函数的对数来估计.因为尺度参数是负的 
所以在估计中我们利用了 h ,( a ). 

例 7 .7再次考虑 IBM 股票从 196 2 年 7 月3曰至1即 8 年12月31日的日对数收 
益率，共有 9 WO 个日收益率的值.表7_ 3 给出了负序列 { _ rt} 在门限的三种选择 
下参数 k ^, ft 的一些估计 结果. 我们利用了负序列 {- rt }, 而不是 { rt }， 这是因为 
我们集中于讨论持有一个多头的佥融 头寸. 此表也给出了给定门限下的超越次数 
可以看出 IBM 股票在1天中降低2. 5 %或者更多的机会出现的概率为310/9 19 U 约 
为 3 . 4 % •因为 IBM 股票收益率的样本均值不是0,所以我们也考虑了当样本均值 
从原始的对数收益率中去除以后的情况.从表中看出， 去除样 本均值后对参数估计 
只有很小的影响.下面利用这些参数估计来计算 VaR . 注意在实际应用中必须要仔 
细检査拟合一个泊松模型的充分性.下面我们将讨论模型检验的方法_ 
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表 7-3 对 IBM 股票从1962年7月3 R 到 19 JIR 年12月31日的 
负曰对数收益率的二维齐次泊松樓型的估计蛣果“ 


Thr. 

Exc. 

形状参数知 

对数（尺度 

位置 0 

3.0% 

175 

原始的对数收益 

-0.306 97(0.090 15) 0.306 99(0.123 80) 

4.692 04(0.190 58) 

2.5% 

310 

-0.264 18(0.065 01) 

0.315 29(0.112 77) 

4.740 62(0.180 41) 

2.0% 

554 

-0.187 51(0.U43 94) 

0.276 55(0.098 67) 

4.810 03(0.172 09) 

3.0% 

IM 

334 

移除杵本均值 

-0.305 16(0.088 24) 0.308 07(0.123 95) 

4.738 04(0.191 51) 

2.5% 

-0.281 79(0.067 37) 

0.319 68(0.120 65) 

4.768 08(0.185 33) 

2.0% 

590 

-0.192 60(0.043 57) 

0.279 17(0.099 13) 

4.848 59(0.172 55) 


a 瑤本的时间间隔为 252 灭（即一年 ). 括号内的数为标准误差，其中叮 &.” 和 “Exc” 表示门 W 
(threshold) 和超越次数 (number of excoedings). 


7.7.4 基于新方法的 VaR 计算 

正如方程 (7.32) 显示的,运用的二维泊松过程模型（它采用了方程 （7.35) 中的 
强度测度）与方程 (7-29) 中的极值分布具有同样的参数值.因此，可以利用与方程 
(7.30) 同样的公式计算新方法下的 VaR . 更具体地，对一个给定的 卜尾 概率仍对数 
收益率 r t 的 （1 - p ) 分位数为 

VaR k (7.38) 

{ 0 + a\n[-D\n(l-p)] t 若 fc = 0， 

其中 D 为估计中使用的基本时间间隔典型地.美国利用 D = 252表示1年中交 
易日的近似数量. 

例 7.8 再次考虑持有一个价值1千万美元的 IBM 股票的多头头寸的 情形. 我们 
利用表 7-3 中的估计结果对尾概率为 0.05 和 0.01 计算持有期为1天的 VaR . 

情形1利用原始的日对数收益率•门限^的三种选择导致了下面的 VaR 值： 

(1) r ； = 3.0%: VaH(5%)=$2 , 28 239, VaR(i%)=$359 303; 

(2) v = 2.5%: VaR(5%；=$219 106, VaH(l%)=$3bl 119; 

(3) r; = 2.0%: VaR({5%)=$212 981, VaR(l%)=$368 552; 

情形 2 消除日对数收益率的样本均值.门限 r / 的三种选择导致，卜面的 VaR 
值： 

{l)rj = 3.0%: VaR(5%)=$232 094, VaR(l%)=$363 697; 

(2) r; = 2.5%: VaR(5%)=$225 782, VaR(l%)=$364 254; 

(3) t/ = 2.0%: VaR(5%)=$217 740, VaR(l%)=$372 372. 

正如料想的，消除样本均值（正值）将使 VaR 稍微有所 增加. 然而， VaR 在门限的 
三种选择下相当稳定.实际中，我们建议将新方法运用到 VaR 计算中之前首先消 
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除样本均值. 

讨论与例 7.6 中的 VaR 相比（那里使用了传统的极值理论)，新方法提供了一个 
更加稳定的 VaR 计算.传统方法对于子区间长度 n 的选择是相当敏感的. 


7.7.5 参数化的其他方法 


如同前面提到的那样,对于给定的门限 r/, GPD 也可以通过形状参数 A* 和刻度 
参数 伽 = a - k ( V -0) 进行参数化.这 iH 是 S - Plus 中所用到的参数化.事实 h , 
S-Plus 中的 （ xi , beta) 对应于本章的在 S-Plus 中估计 GPD 模型的 
命今是 gpd. 为了说明，考虑从1962年到1998年的 IBM 股票的负日对数收益率. 
结果如下： 


>nibm.gpd^gpd(-ibm,throohold^O.026) 


"n" "data" 

"upper.exceed" n lower.exceed” 

H upper. thresh" •• lower • thresh" 


>names (nibm. gpd) 

Cl ] 

[3] 

C 5] 

[7] "p•less.upper.thresh" 
[9] "n•upper.exceed" 

[11] "upper • method 11 
[13] "upper.pax.ests" 

[15] "upper.par.ses•• 

[17] "upper•varcov" 

[19] "upper.info" 

L21J M upper.converged" 

[23] "upper.nlUi.final M 
>nibm.gpd$upper.thresh 
[1] 0.025 


H p.larger.lower.thresh" 
••n • lower. exceed" 

"lower.method" 

•• lower. par. ests n 
11 lower, par. ests M 
"lower.varcov" 

••lover .info" 

"lower.converged” 

•’ lower, nllh.t inal •• 


>nibm. gpd$n. upper. exceed 5i nurnbur oX exceedances 
[1] 310 

>nibm.gpd$p.less.upper.thresh X 1-prob (exceedance) 
Cl] 0.9662677 
>nlbm.gpd$upper.par•eats 
xi beta 

0.2641418 0.00778777 
>nibm•gpd$upper.par.ses 
xi beta 

0.06659759 0.0006715558 
>par(mfcol*c(2,2)) 

>plot(nibm.gpd) 
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Make a plot selection (or 0 to exit) : 

1: plot: Excess Distribution 

2: plot : Tail of Underlying Distribution 

3: plot: Scatterplot of Residuals 

4: plot: QQplot of Residuals 

Selection: 

注意到结果与表 7-3 中的结果非常靠近.表 7-3 中用的是对数收益率的百分比. 
在表 7-3 中 A : 和 _ 的估计分别是 -0.264 18和 a - *(7；- 办）= exp (0.3152 9)- 
(-0.264 18)(2.5 - 4.740 6) = 0.778 73. 对于对数收益率， ^( rj ) 的估计是 0.007 787. 
这与 S - Plus 的估计结果一样. 

图 7-7 显示了给 IBM 股票的负日对数收益率拟合 GPD 的诊断检验图 . QQ 图 
(右下角）和尾概率估计（左下角.并取对数刻度）显示出与直线有微小的偏差这 
表明可能需要进一步的改进. 

1.0 
0.8 
i U.6 
£ 0.4 
0.2 
0.0 



片以对数尺度） 序列数 

图 7-7 给 IBM 股票拟合从 1962 年 7 月 3 日到 1998 年 12 月 31 日的负日对数收益率 
GPD 的诊断检验图 

对于 （ 7.31) 式、 (7.32) 式以及 （ 7.33) 式的 GPD 的条件分布，我们有 

ny)-F(y) 

1 - F(r)) . 咖 )( x )， 

其中！ / 一 : r + 77, x > 0. 如果我们通过经验 cdf 来估计收益率的累积分布函数 F(r/), 
则 



1IHIII 

i(«!( 
o.a 
«N« 玆 T:1)x:-J.l 
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其中况,是超越门限77的次数， r 是样本容量.因此 
尸(!/)=增+啊1-糊 

~1 Nv \i k ^-^ Y /k 

1 t L 1 懒 J • 

这就引出了 VaR 计算中所用到的 F { y ) 的分位数的另一种估计.特别地，对于上尾 
概率 p， 其中0 < p < 0.05, 令 g = 1 -p, 则 F(!/) 的 g 分位数 VaR, 可以由下式估计 

VaR, =7/-f|l - -fl)j J, (7.39) 

其中，如前面一样7；是门限, r 是样本容量，是超越门限的次数， GPD 的刻度参 
数和形状参数分别为 懒 和 fc. 在 S-plus 中正是用此种方法计算 VaR 的. 

与 VaR 有关的另外一个经常用的风险度量是期望不足 (uxpiicLed shortfaU, ES). 
它定义为超过 VaR 后的期望损失.特别地，对于给定概率 g (具体地 ， 0.95 ^ 9 ^ 1), 
期望不足定义为 


ES, - E(r|r > VaR.,) - VaR, + E(r - VaR^r > VaR^). 
利用 GPD 的性质，可以证明 

E(r -VaR < ,|r> VaR,) = _”). 

上式中0 > fc > -1. 因此,我们有 




(7.40) 


为了说明计算 VaR 和 ES 的新方法，我们仍然应用 IBM 股票的负日对数收益 
率，且其门限为 2.5%. S-Plus 命令为 
riskmeasures: 


> riskmeasures(nibm.gpd, c(0• 95<0 •99)} 
p quantile sfall 

[1 # ] 0.95 0.02208893 0.03162723 
[2 t ] 0.99 0.03616619 0.05075763 

从输出结果来看，对于尾概率 0.05 和0.01，金融头寸的 VaR 值分别为$220 889 
和$361 661. 这两个值与例 7.8 给出的值非常靠近.例 7.8 的结果基于前一小节所 
给出的方法得到.对于尾概率 0.05 和0.01，金融头寸的 ES 分别是$316 272和 
$507 576. 
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7.7.6 解释变量的使用 


前面讨论的二维泊松模型是齐次的，因为三个参数 A -， a 和随时间不变.实 
际中，这种模型可能并不充分.此外，通常要利用一些能够影响对数收益皁的解 
释 变量. 新的极值理论方法对 VaR 计算的一个好的特性是它能很容易地将解释变 
量考虑进來.本小节将讨论这样个考虑解释变量的框架.另外，我们也讨论可以 
用来检验所拟合的二元泊松模型充分性的方法. 

假定 A = ( xu , ••-，^)'是 v 个解释变量的向量，在时刻 t 以前就可以得到. 
对资产收益率，第3章讨论的 n 的波动率 a t 2 是-个解释变童的例子.美国证券 
市场上解释变童的另一个例子是表示联邦公开巾场委员会 （Federal Open Market 
Committee ) 会议的示性变量.利用解释变童的一个简单方法是猜想三个参数« 
和是时变的，而且是解释变量的线性 函数. 具体地，当解释变量:可以得到时， 
我们假定 

= To + 7l*u H - h lvx v t =7o -h 

4* S \ X\t 4* •.. + S v x v t = <5 q 4 - (7.41) 

Pt — + 0\X\t + •••. + 0 v x v t =0 q + O'xt. 

如果 7 = 0 , 则形状参数心 = 70 ,且它是随时间不变的. 这样， 检验 7 的显著性可 
以提供关于解释变量对形状参数的贡献的信息.类似的方法可以运用到尺度参数和 
位置参 数中. 在方程 （7.41) 中，我们对所有的三个参数匕， ln ( a t ) 和沭都使用了同 
样的解释变量.在应用时，不同的参数可以使用不同的解释变量. 

当极值理论的=个参数是时变的时候，我们得到一个非齐次的泊松过程.强度 
测度变为 


A\(D i ,D 2 )x(r,oo)] 


D2 - D \ 
~~ D ~ 


ki(r - p t )\ l/kt 


(7.42) 


超出时间点和收益率的似然函数变为 
L 


〜1 \ 
n 护 ( r d a *,， 久） 

/ 


\ 

• 1 c T 

I x exp 

一万 j 。 S{T)\k t ,a t ^ t )dt 


如果假定参数叫和汍在每个交易 H 内是固定的，其中和 S ( rr , k tt 
分别由方程 （7.36) 和 (7.35) 给出，则似然函数简化为 

1 r 1 
—万 . (7.43) 


>-1 


exp 


对给定的观测值 { r u x t \t = 且基本的时间间隔为 D , 门限为％方程 

(7.41) 的参数可以通过最大化方程 （7.43) 的对数似然函数来估计.这里再一次使用 
了 ln ( a t ) 来满足％为正的限制. 
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注释：从三个参数却是时刻 < 时可以得到信息的精确函数这个意义上讲，方 
程 (7.41) 的参数化类似于第3章中波动率模型的参 数化. 如果有必要也可以使用 
其他函数. 口 

7.7.7 模型检验 

对超越次数和超出量检验的二维泊松过程模型进行检验涉及检验模型的三个 
重要性质.第一个性质证明超越率的充分性;第二个性质检验超越的分布；最后一 
个性质检验模型的独立性假设.我们主要讨论在检验这三个性质时有用的一些统 
计景，这些统计童基于一些基本的、与分布和随机过程相关的统计理论 • 

超越率 

一维泊松过程的一个基本性质是接连的两个事件之间的时间持续期是独立的 
且都服从指数分布.为了采用检验一个二维过程模型的类似性质， Smith 和 Shively 
(1995) 提出了研究接连的两个超越间的时间持续期.如果这个二维的泊松过程模型 
对超越次数和超越量是恰当的，则第 i 个超越与第； - 1个超越之间的时间持续期 
应该服从一个指数分布.更具体地，令知= 0,我们期望 
卜 1 

Zt % = J —i = l ， 2, … 

是独立同分布 （ i . i . d .) 的，且均服从一个标准指数 分布. 因为日收益率是离散时间的 
观测值.我们采用的时间持续期为 

Zt .=^ E S ( v ; k tl au 0 t ), (7.44) 

并利用分 位数分 位数 ( QQ ) 图来检验独立同分布标准指数分布的有 效性. 如果模 
型是充分的，则 QQ 图应显示一条通过原点且斜率为1的直线 • 

超越量的分布 

在所考虑的二维泊松过程模型下,超过门限 r / 的超越量= n-T) 的条件分布 
是一个形状参数 为幻， 尺度参数为 Ipi=at-kt(v-0t) 的广义帕累托分布 ( GPD ). 
因此，我们可以利用标准指数分布与 GPD 之间的关系，定义 


% = 卜 

I ^ 

如果模型是充分的，则 { wt .} 是独立的且服从均值为1的指数分布.可参见 Smith 
(1999). 我们可以利用 QQ 图来对检验超出量 GPD 假定的有效性. 


(1 - ~)，若 笋0, 


若 / e t , = 0. 
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独立性 

在调整解释变量的影响以后，检验独立性假定的一个简单方法是研究仏与 
叫. 的样本自相关函数.在独立性假定下，我们 期望％ 和叫.的序列相关系数都是 
零. 

7.7.8 说明 

在本小节中，我们对 IBM 股票从1962年7月3日至1998年12月31日以百 
分比表示的日对数收^率采用了一个二维非齐次的泊松过程模型.我们集中于讨 
论持有一个1千万美元的多头头寸.该分析使我们能够与前面利用其他方法计算 
VaR 所得到的结果相比较. 

首先我们指出例 7 .7中的二维齐次模型需要进一步 提炼: 因为拟合的模型没能 
通过 7.7.7 节中的模型统计量的 检验图 7 - 8 a 与图 7 -8b 显示了齐次 模型当 门限为 
V = 2.5%时，和叫，的自相关函数，其定义分别见 (7.44) ^ (7.45). 图形中的两 
个水平线表示两个标准误差的渐近上下限.可以看出和序列都有某些显著 
的序列相关性.图 7 -£)a 与图7 9b 显示了 和 u; t< 序列的 QQ 图，每个图形中的 
直线都为理论线，它过原点开且在标准指数分布假定下斜率为 1. \的 QQ 图显 


( a ) 齐次: 2 ( c ) 非齐次： 2 



问明 间隔 


图 7 -8二维非齐次泊松过程模型中的 z 和序列的样本自相关函数 .（ a ) 与 （ b ) 显示对齐次 
模型的 结果； （ c ) 与 （ d ) 显示对非齐次模型的结果 • 所用数据力 IBM 股票从〗962年7 
月3日至1998年12月31日以百分比表示的、经均值修正后的日对数收益串，门限 
为 17 = 2.5%.所使用的是多头金融头寸 
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图 7-9 二维非齐次泊松过程模型中的 S 和 ir 序列的 QQ 图 .（ a ) 与 （ b ) 显示对齐次模 
型的 结果； （ C ) 与 （ d ) 显示对非齐次模型的结果.所用数据为 IBM 股票从1962 
年7月3日至1998年12月31 R 以百分比表示的、经均值修正后的 R 对数收 
益率，门限为77 = 2.5%.所使用的是多头金融头寸 

示了某些不相符性. 

为 f 提炼模型，我们使用均值修正的对数收益率序列 

1 9 190 

r ° = rt ~ f * f= 9l9oE^ 

其中 r t 为百分比表示的日对数收益率，并且采用下而的解释变量. 

(1) x lt ： 对10月、11月和12月的示性变量.即，如果 f 在10月、11月或12 
月，则= 1. 选择这个变量是考虑到四个季度对 IBM 日对数收益率的影响（或 
称年末效应 M 如果这种影响效应存在的话). 

(2) x 2 t ： 对前一个交易日行为的示性 交量. 具体地,= 1当且仅当对数收益 
率< -2.5%.因为我们集中于讨论门限为2.5%的一个多头头寸，当价格降低 
超过2.5%时超越发生.因此，当 IBM 股票的价格相对于前一天交易日的价格降低 
2.5%或更多时，使用; r 2 t 来刻画恐慌抛售的可能性. 

(3) x 3 t ： 波动率的一个定性测度,它是1 与 t 一 5( 包含 t - l 和 <-5)之间的 
具有超过 M 限的对数收益率的天数.在所考虑的情形下，: r 3 t 是满足 IU 彡2.5%, 
< =1，...，5的4一 的个数. 

(4) x 4 f ： 年趋势，定义为: r 4t =(时刻所在的年份- 1961)/38. 用此变量来识别 
IBM 股票极值收益率行为中的任何趋势. 
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(5) x 5t : 基于对均值修正序列 rf 的髙斯 GARCH(1,1) 模型的波动率序列.具 
体地，吻=%这里疗为 GARCH(1,1) 模型 

r ? =«e, a t = <r t e u c t ~ AT(0,1), 

a 2 t = 0.045 65 + 0.080 7 a?_i + 0.903 

的条件方差. 

这 5 个解释变量在时刻都可以得到.我们利用两个波动率测度 （ar 3t 与吻）来 
研究市场波动率对 VaR 的影响.正如例 7.3 中拟合的 AR(2)-GARCH(1,1) 模型所 
显不的， r f 中的序列相关性很弱，以至于我们不能对均值力程接受任何 ARMA 模 
型. 

利用前面的 5 个解释变量.并且消除不显著的参数.我们得到表 7-4 显示的估 
计 结果. 图 7-8c 和 (1 以及图 7-9c 和 d 显示了当门限是 r/ = 2.5%时拟合的二维非 
齐次泊松过程模型的模型检验统计量. 与叫. 的所有自相关函数都在两个标准 
误差的渐近上下限之内 .QQ 图也显示了显著的改善，尽管它们表明没有模型的充 
分性.根据检验结果，非齐次模型看上去是充分的. 

表 7-4 对 IBM 股栗从 19 B 2 年7月3日到1908年12月31日以百分比表示的 


曰对数收益的二维非齐次泊松过程模型的估计结果 a 








mug 

门限 2.5%, 带 3.34 个超越 

■■■■ 

Sails 















mmm 

(标准误差） 





k * 





(标准误差） 






■mm 

门限 3.0%, 带 184 个超越 


mm 

0 t 





(标准误差） 
• n ( a «) 




BS 

(标准误差） 





kt 





(标准误差） 






a 利用了文中定义的四个解释 变衆. 此模型足为持有 IBM 股栗的多头头寸设定的，消除了对数收益率 
数据的样本均值. 


考虑门限为 2.5% 的情形.估计结果说明如下几点. 

(1) 强度函数的所有 3 个参数都显著依赖于年时间趋势.特别地，形状参数有 
一个负的年趋势,表明随时间的变化, IBM 股栗的日对数收益率偏离正态性越来越 
远.位置参数和尺度参数都随时间增大. 
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(2) 第 4 个季度的示性变量: r u 与恐慌抛售的示性变量 i ： 2 t 对所有的3个参数 
都是不显著的. 

(3) 受 GARCH ( U ) 模型的波动率影响的位置参数和形状参数是正的 （见; 
的系 数). 这是可以理解的，因为当波动率高时，对数收益率的可变性增加了，从而 
降低了对数收益率对尾指数的依赖性. 

(4) 尺度参数和形状参数显著依赖于波动率的定性度量.估计的符号也似乎是 
合理的. 

I " 8 年 I 2 月 3 1 日的解释变量假定为 a ?3,9190 = Oj ^4,9 190 = 0.973 7, 15,9 190 ― 
1-976 6. 利用这些值以及表7 4 中拟合的模型，假定尾概率为0.05,我们得到 

^9 190 = -0.011 95, ln ( a 9 190 ) = 0.193 31, ^9190 = 6.105. 

方程 (7.38) 显示的 VaR 分位数给出 VaR — 3.037 56%.因此，对一个1千万美元的 
多头头寸，我们有 

VaR = 10 000 000 x 0.030 375 6 美元= 303 756 美元. 

如果尾概率是0.01，则 VaR 为 497 425 美元 • 5%的 VaR 稍高于例 7.3 中利用 
AR (2)- GARCH (1, 1) 模型给出的结果.1%的 VaR 远远髙于例 7.3 情形1的结果. 
如我们所料，极值（即 厚尾） 对 VaR 的影响当使用的尾概率较小时更加重要. 

采用解释变量的一个优势是参数适应市场条件的变化.例如，对1998年12月 
30 日的解释变量假定的值为 ^3.9189 = 1, ^4,9189 = 0.973 7, X 5 ,g 189 = 1.875 7.在这 
种情形，我们有 

^9189 = 一 0.250 0， ln ( tt 9 189) = 0.523 85,汍 189 = 5.883 4. 

则分位数（即尾概率为5%)变为 2.691 39% . 因此， VaR 变为 

VaR = 10 000 000 x 0.026 913 9 美元= 269 139 美元. 

如果尾概率为0_01，则 VaR 变为 448 323 美元.根据这个例了•例 7.8 中显示的齐 
次泊松模型似乎低估了 VaR . 

练习题 

71 考虑 GE 股票从1962年 7 月3日至1999年12月31日的日对数收益率.此数据可以从 
CRSP 或者文件 d-ge6299.txt 中得到.假定你持有这只股票价值 100 万美元的多头头 
寸.采用尾概率 0.05, 并利用下面的方法计算丨天持有期和 15 天持有期的风险值 ( VaR ). 

(a) 风险度量制方法. 

(b) 髙斯 ARMA-GAHCH 模型. 

( c ) 带学生分布的 ARMA - GARCH 模型，这时你也需要估计自由度. 

( d ) 子区间长度为 r * = 21 的传统极值理论. 
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7.2 文件 d . csco 9199. txt 含有 Cisco 系统股票从1991年到1999年的日对数收益率，共 
2 275个观测值.假定你持有 Cisco 系统股票的一个价值100万美元的多头头寸.利用概 
率 p = 0.01，计算你的头寸在下一个交易日的风险值. 

( a ) 利用风险度量制方法 

( b ) 利用带条件高斯分布的一个 GARCH 模型. 

( c ) 利用带学生 t - 分布的 GARCH 模型，你也町能要估计自由度. 

( d ) 利用无条件样本分位败. 

( e ) 利用一个门限为2%的二维齐次泊松过程 • 也就是说，讨论股栗日价格降低2%或更 
多的超越次数和超越量.检验拟合的 模型. 

( f ) 利用一个门限为2%的二维非齐次泊松过程.解释变量为①年时间 趋势； ②对10 
月、11月和12月的哑 变量； ③基子一个髙斯 GARCH (1,1) 模型拟合的波动率.对 
拟合的樓型进行诊断检验. 

( g ) 利用门限2.5%和3%重复前面的二维非齐次泊松过程.评论门限的选择. 

7.3 对 Cisco 系统的日股票收益率利用 HU 1 估计以及数据 d - csco 9199. txt 估计尾指数. 

7.4 文件 d - hwp 3 dx 8099. txt 含有 Hewlett - Packard , CRSP 价值加权指数、等权重指数和 
S&P 500指数从1980年到1999年的日对数收益率.所有的收益率都以百分比表示，并 
且包含红利分布.假定感兴趣的尾概率为 0.01. 对下面的金融头寸计算2000年第一个交 
易日的风险值. 

(a) 持有100万美元的 Hewlett - Packard 股票和100万美元 S & P 500 指数的多头，并且 
使用风险度景制方法.对每个序列都蒲要估计 IGARCH (1，1) 模型的 a 系数. 

( b ) 与 （ a ) 有问样的头寸，但是对每个序列利用一个一维 ARMA - GARCH 模型 • 

(c) 对持有 100 万美元的 Hewlett-Packard 股票的多头，利用一个二维非齐次泊松模型. 
解释变量如 下：① 年时间 趋势； ②对 Hewlett-Packard 股票基于 GAHCI1 模型拟 
合的波 动率; ③ 4 对 S & r 500 指败基于高斯 GARCH 模型拟合的波 动率; ④对价值加 
权指数收益基于高斯 GARCH 模型拟合的波动率.对拟合的模型实施诊断检验.由 
S&P500 指数与价值加权指数收益宇测量的市场波动率在决定 Hewlett-Packard 的 
股票收益率的尾行为卜有意义吗？你可以选择几种不同的门限. 

7.5 考虎从1980年到2003年的 Alcoa ( AA ) 股票和 S & P 500 综合指数 ( SPX ) 的日收益率. 
文件 d - aaspx 8003. txt 包含简单收益率和日期数据.将简单收益率转换为对数收益率. 
并研究 Alcoa ( AA ) 股票的负日对数收益率. 

(a) 给 Alcoa ( AA ) 股票的负对数收益率（以百分比的形式给出）拟合一般极值分布.子区 
间的长度是21个交易日.写出参数估计值及其标准误差.绘制残差的散点图和 QQ 
图. 

( b ) 当用区间长度为21天的24个子区间时，前面所拟合模型的收益率水平是多少？ 

( c ) 当门限为2.5%时，绘制负的对数收益率的 QQ 图以及收益率的超额均值图. 

( d ) 当门限为3.5%时，给负的对数收益率 拟合厂 义帕累托分布 ( GPD ). 写出参数估计值 
及其标准误差. 

( e ) 绘制以下 图像： 

( i ) 超额分 布图； 

( ii ) 标的分布的尾部的图像， 
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( iii ) 残差的散 点图； 

( iv ) 所拟合 GPD 的残差的 QQ 图. 

( f ) 基于所拟合的 GPD 模型.计算概率为 9 = 0.95, 0.99 和 0.999 时的风险值 （ VaR ) 和 
期望不足. 

7 6仍然考虑练习题 7.5 中的 Alcoa ( AA ) 股票的日对数收 益率. 现在我们关注的是正的日对 
数收益率.回答练习题 7.5 中同样的 问题. 然而，在拟合 GPD 模型时，使用的门限为3%. 
7 . 7 考虑 d - aaspx 8003. txt 文件中 S & P 500 综合指数 ( SPX ) 的日收益率.将收益率转换为 
刘数收益率，并研宄负的日对数收益率. 

( a ) 给 S & P 500 综合指数的负对数收益率（以百分比的形式给出）拟合一般极值分布.子 
区间的长度是21个交 易日. 写山参数佔汁值及其标准误差.绘制残差的散点图和 QQ 
图. 

( b ) 当用区间长度为21天的; M 个子区间时，前面所拟合模型的收益率 水甲是 多少？ 

(**) 当门限为 2.5% 时，绘制负的对数收益率的 QQ 图以及收益率的超额均值图 • 

( d ) 当门限为2.5%时.给负的对数收益率拟合 GPD . 写出参数估计值及其标准误差. 

( e ) 绘制以下 图像： 

(0 超额分 布图； 

( U ) 标的分布的尾部的 图像： 

( iii ) 残差的散 点图； 

( iv ) 所拟合 GPD 的残差的 QQ 图. 

( f ) 基于所拟合的 GPD 模型，计算概率为 9 = 0.95, 0.99 和 0.999 时的风险值 （ VaR ) 和 
期望不足 (expected shortfall ). 
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第 8 章多元时间序列分析及其应用 

近年来，经济全球化与网络交流已经加速了世界金融市场的一休化.申个市场 
的价格变动能够很容易迅速地扩散到另一个市场.因此，金融市场比以前更加相互 
依赖了.为了更好地理解全球金融的动态结构，必须将它们联合起来 考虑. 在茉些 
情况下 ，一 个市场可能引导另个市场，然而在其他情形下这种犬系也可能颠倒过 
来.因此，了解市场如何相互关联在金融中相当重要.类似地，对持有多个资产的 
投资者或金融机构，资产收益率间的动态关系在决策制定的过程中起着很重要的作 
用.本韋和第9章引进有用的金融计量经济学模型和方法来联合研究多元收益率 
序列.在统计文献中，这些模型和方法属于向置或多元时间序列分析. 

多元时间序列包含多个一元时间序列作为其分量.因此，向童与矩阵的概念在 
多元时间序列分析中非常重要.如有必要，读者可以查阅本章中的附录 A 来了解向 
量和矩阵的一些基本运算和性质.附录 B 给出了多元正态分布的一些结果，并且 
这些结果在多元统计分析中应用很广泛（如 Johnson 和 Wichem 1998). 

令 r t = (r u ，7* 2t ，... 表示知个资产在时刻《的对数收益率，这里 Y 表示 
a 的转置.例如，一个投资者持有 IBM、 微软公司、埃克森美孚公司、通用汽车公司 
和沃尔玛超市的股票，则他可能考虑由这些公司的日对数收益率所构成的5维向 
量.这里表示 IBM 股票的日对数收益， r 2 , 表示微软的，等等.再如，一个对全 
球投资感兴趣的投资者，可能考虑美国 S&P500 指数、英国 FTSE100 指数以及日 
木的 Nikkei225 指数的收益率序列.这时序列是3元的， r lt 表示 S^P5nO 指数的收 
益率； r 2t 表示 FTSE100 指数的收 益率； 表示 Nikkei225 指数的收益率本章的 
目的是研究一些计量经济模型来分析多元过程 r t . 

前几章中讨论的许多模型和方法可以直接推广为多元的情形.但是在有些情 
形下，这种推广需要注意一些问题.在某些情形下，需要新的模型和方法来处理多 
个收益率之间的复杂关系.本章对这些问题的讨论强凋直观性和实用性.关丁多元 
时间序列分析的统计理论，读者可以参考 Liitkep 0 hl(1991) 和 Reinsel(1993). 

8.1 弱平稳与交叉-相关矩阵 

考虑一个 A： 元时间序列 r t = (r u ,r 2t ,-- - ,r w y . 称序列 r t 是弱平 稳的，如果 
它的一阶矩与二阶矩不随时间变化.特别地，弱平稳序列 r, 的均值向量和协方差 
矩阵不随时间改变.除非明确地说明序列非平稳，我们都假定金融资产的收益序列 
是弱平稳的. 
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对一个弱平稳时间序列 n 其均值向量和协方差矩阵定义为 

/x = E(r t ), r 0 = E[(r t - - ^)'], (8.1) 

这里的期望是由 n 的联合分布对每个分量取期望得到的.均值//是由 r< 的分量 
的无条件期望组成的 A : 维向景 • 协方差矩阵 r 0 是 it x A 矩阵 . r 0 的第 i 个对角线 
上的元素是〜的方差，而 h 的第 (*, i ) 个元素 是〜与 r # 的协方差.需要用到 
其元素时，我们记 

綷 _ (川，…， Mfc /， [0 = ⑼）. 

8.1.1 交叉_相关矩阵 

令 D 表示由 U(i = 1,... . fc ) 的标准差构成的 kxk 对角矩阵.换句话说， 

D = diag { v ^^ 1 ...， Vf ^(0)}. 

则 r t 的同步或延迟为0的 交叉相 关矩阵定义为 


Po = ( Py (0)] = D ^ ToD ^. 
更貝体地 ，外 的第 （ i , j ) 个元素为 


PO ⑼ 


r » j ( Q ) _ Cov(r “， r #) 
^*(0)^(0) ~ std ( r it ) std ( r jt ) 


它是 r it 与 r jt 间的相关系数.在时间序列分析中，此相关系数称为共点或同步相 
关系数.因为它是两个序列在同一时刻 < 的相关性.很容易看出 PtJ (0) = ^,(0), 
-1< 叫⑼ < 1;且 Pii (0) -1, 因此， P (0) 是具有单位对角元素的对称 

矩阵. 

多元时间序列分析中一个重要的主题是分量序列之间的引导-延迟关系 ( lead - 
lag ). 为此，用交叉相关矩阵来衡量时间序列之间线性依赖的强度 . n 的延迟为 Z 
的交叉协方差矩阵定义为 


r < — fT»j(0] = E[(r t - - /x )']， (8.2) 

其中是 r t 的均值向量.因此，的第 （ i ， j ) 个元素为 r « 与间的协方差. 
对弱平稳序列，交叉-协方差矩阵是 f 的函数，与时间指数/无关. 

r t 的延迟为 f 的交叉-相关矩阵 （_ lag-l cross-correlation matrix , CCM ) 定义为 


^ = ^(0]=0- 1 ^- 3 , (8.3) 

这里同前面一样， D 是由单个序列〜的标准差构成对角矩阵.由定义， 

Pi M ) = - , ~(’） = Covjru ,^) 

3 v/r“(0)I^(0) std(r“) s td( ri 0 


(8-4) 
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是〜与的相关系数.当！ > 0时，此相关系数衡量了〜对发生在 < 时刻 
以前的 r ^- t 的线性依赖.因此，如果 Pa ( l ) 參 ( J 且 Z > 0,我们就说序列7^在延 
迟/处引导着序列 r «. 类似地， p 3 i { l ) 衡量了 M 对 r ,, t -/ 的线性依赖，并且如果 
Pji ( l ) # 0且 Z > 0,我们就说在延迟 f 处引导着序列 r it . (8.4) 式还表明郎⑴ 
的对角元素恰恰为 r « 的延迟为 f 的自相关系数 

根据上述讨论，我们得到当/ ：> 0时，交叉-相关阵的一些重要性质.首先，一 
般地，对 〆 J ， 有 PiAl )-/- Pn ( l ), 这是因为这两个相关系数衡量的是{『“}与 { r Jt } 
之间的不同的线性关系.因此，弓内一般是不对称的.其次，由 Cov ^. r ^.,)- 
Cov ^. t -^ ru ), 以及弱平稳性假定，我们有 

Cov ( r < t , rj , t _{) = Co \( rj , t - i , rit ) = Cov ( r Jt , r l i , t -^) = Cov [ rj t , r <t 

因此 r^D = ry - o .因为 ^(-0 为矩阵 r _, 的第 0， i ) 个元素，且这个等式对 
成立，所以我们有 r , = 1%灼= 乂,. 因此，与一元情形不同，对一般 
的向量时间序列来说，当 z > 0时 . 仍/ 因为仍= p ' ,，所以在实际中，只考虑 
时的交叉相关矩阵 a 就足够了. 

8.1.2 线性相依性 

综合起来，一个弱平稳向量时间序列的交叉相关矩阵 {pj = 0,1， ... } 包含下 
面的信息. 

(1) 对角元素{~(01纟= 0，1,...} 是 r it 的自相关函数 • 

(2) 非对角元素 Pi ,(0) 衡量的是 r « 与&之间的同步线性关系. 

(3) 对 Z > 0,非对角元素 PiAD 衡量的是 r , t 对过去值的线性依赖 • 

因此，如果对所有的 Z > 0,都有~(/) = 0,则 r « 并不线性地依赖于 r 』 t 序列的任 
何过去值以 i . 

一般地，两个时间序列与 { r jt } 之间的线性关系可以概括如下. 

(1) 如果对于所有的 Z > 0,都有 Pij ( l ) ^郎⑴= 0,则 r *, t 与以没有线性关系. 

(2) 如果叫⑼笋0,则与 r # 是同步相关的. 

(3) 如果对于所有的 Z > 0, p tj { l ) — 0且 印⑴ — 0,则〜与 w 没有 引导延 迟 
关系.这时称这两个序列是分离的. 

(4) 如果对于所有的 Z > 0, Pi j { l ) = 0,但是对某些 v > 0,有 Pji ( v ) ^ 0,则从 
r « 到以有一个单向关系.此时， r it 并不依赖于 r # 的任何过去值，但是以却依 
赖于 r « 的某些过去值. 

(5) 如果对某些 f > 0, Pi j { l ) ^ 0；而且对某些 v > 0,郎(的尹0,则 r » 与 rjt 之 
间具有一种反馈关系. 

前面陈述的条件都是充分条件.研究时间序列之间关系的更加有效的方法是对序列 
构造一个多元模型，因为一个恰当特定的模型同时考虑/该时间序列的序列相关性 
及序列之间的交叉相关性. 




8.1.3 样本交叉-相关矩阵 
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给定数据 { r £ |« = l t ..., T }, 其交叉协方差矩阵可以通过下式佔计 
1 T 

= T ^2 ( r * ^)( r «-< W ， 1 > °> (8.5) 

t=/+i 

这里 f = f ： r t / T 为样本均值向童. 交叉相 关矩阵灼的估计为 

p t = D ^tiD \ 1^0, ( 8 . 6 ) 

其中办是分量序列的样本标准差构成的 fc x fc 对角矩阵. 

类似于一元情形，样本交叉相关矩阵別的渐近性质在各种假定之下都已给 
予研究了.例如可以参见 Puller (1976, 第6章).这个估计是相合的，但对于有限 
样本是有偏的.对于资产收益率序列，仏的有限样本分布相当复杂.部分原闵是由 
于条件异方差与高峰度的出现.如果需要交叉相关的有限样本分布，我们建议利 
用适当的自助 ( bootstrap ) 重新抽样方法得到分布的近似估计.对于许多应用而言, 
Pij ( l ) 方差的一个粗糙估计就足够了. 

例 8 .1 考虑 IBM 股票弓 S&PMO 指数从1926年1月至1999年12月的月对数 
收益率，共 888 个观测值.该收益率包括了红利支付，并且以百分比表示.分别用 
nt 和 r 2t 表示 IBM 股栗与 S & P 500 指数的收 益率. 这两个收益率组成了一个二元 
的时间序列 r t = ( r lt ， r 2 t y •图 8~ i 给出了同样尺度的 n 的时间图.图心2给出了 
两个序列的一些散点图.这些图像表明这两个时间序列是冋步相关的.事实上，两 
个收益率之间的样本问步相关系数是 U .64, 这在5%水平下是统计显著的.然而，1 
步延迟的交叉相关若有的话也是很弱的. 


图 8>1 


( h ) IBM 股票的月对数收 益率: 1962年1月到 19 JW 年12月 



| I r i — 1 

1940 19 G 0 198() 2000 

( b ) S & 151)0 指数的月对数收 益率： 192 G 年1月到1999年12月 



IBM 股票 （ a ) 与 S & P 500 指数 （ b ) 从1926年 i 月罕1999年12月的 
月对数收益率的时间图 
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m 8-2 IBM 股票与 S & P 500 指数的月对数收益率的一些散点 ffl ，( a ) IRM 股票与 SfePSOO 
指数的同步阁： （ h ) S & P 500 对延迟1步的 IBM ; ( c ) IBM 对延迟1步的 S&P 500; 
( d ) S & P 500 对延迟 1 步的 S & P 500 

表84给出 f 两个序列的一些概括性统计量与交叉相关矩阵.对一个一元序 
列，每个 CCM 都是一个 2 x 2 矩阵，包含4个相关系数.实证经验表明很难同时吸 
收许多的交叉相关矩阵，尤其是当维数大于3时.为了克服这个困难.我们利 
用 Tiao 和 Box (1981) 的简化记号，并且定义一个简单的交叉相关矩阵，它包含三 
个符号“+”，和其中 

(1) “+”意味着相应的相关系数大于或等于 2/ n / T ; 

(2) “-” 意味着相应的相关系数小于或等于 -2/ W ; 

(3) 意味着相应的相关系数介于 - 2 / v /^ 与 2 /V 宁之间 - 

此处 2/ VT 是假定 r t 为一个白噪声时，在 5% 渐近水平下枰本相关系数的临界值. 

表 8-1(； 给出了 IBM 股票与 S & P 500 指数的月对数收益率的简化 CCM . 很容 
易看出在 5% 渐近水平丄显著的交叉相关主要出现在延迟 1 和延迟 3 处.检査这 
两个延迟的样本 CCM 可见 ： （ a ) S & P 500 指数的收益率在延迟 1 与延迟 3 处有某 
些边际自相关性； （ b ) IBM 股票收益率对 S & P 500 指数的过去收益率的依赖关系很 
弱.后一观测是根据交叉-相关在延迟 1 与延迟 3 处的 CCM 的第 (1,2) 个元素的 
显著性. 

图 8~3 显示了两个序列的样本自相关与样本交叉相关.对延迟为 0 的 ACF m 
言是对称的，我们只给出了具有正的延迟值的 ACF . 因为使用 S & P 500 指数收益率 
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表 8>1 IBM 股票和 S & P 500 指数的月对数收益率的概括性统计量和交叉-相关矩阵 
(时间段是 1 S 2 fi ^ 1月至年12月） 


(h) 槪栝 忭统 ii-a 


最小变动价位 

均值 

标准误差 

偏度 

超额峰度 

最小值 

最大值 

IBM 

1.240 

6.729 

—0.237 

1.917 

-30.37 

30.10 

S&P5 

0.537 

5.645 

—0.521 

8.117 

一 35.58 

35.22 


_ ( b ) 交叉-相关矩阵 _ 

~延迟1 延迟2 延迟3 延迟4 延迟5~ 

0.08 0.10 0.02 -0.00 -0.02 -0.07 -0.02 -0.03 0.00 0.07 

0.04 0.08 0.02 -0.02 -0.07 -0.11 0.04 0.02 0.00 0.08 

_ (e) 简单记号_ 


的延迟值来计算交叉相关,所以图 8>3 c 中与延迟相联系的图给出了 IBM 股票收 
益率对过去的 S & P 500 指数收益率的依 赖性； 与负延迟相联系的图给出了 S & P 500 
指数收益宇对过去的 IBM 股票收益率的线性依赖性.图中的水平线是样本自相关 
弓样本交叉相关系数的两个渐近标准差的上下限.从图中可以看出，两个收益率 


(«) 



阁8~3 两个月对数收益率的样本自相关和 交叉相 关函数： （ a ) IBM 股票收益率的样本 ACF ; 
( b ) S & P 500 指数收益率的样本 ACF ; ( c ) IBM 的收益率和 S & P 500 指数收益率的延 
迟值的 交叉相 关系数 

















8-4 美国政府债券的月简鱼收益串的时间图.期限分别是 （ a ) 30年 期限； （ b ) 20年期限： 

( c ) 10年期限 •• ⑷5年 期限； （ e ) 1年期限.样本时间段是1942年1月至1999年 
12月 

例 8 . 2 考虑期限分别为 3 0 年， 2 0 年、 10 年 . 5 年和 1 年的美国政府债奍指数的 
月简单收益苹.数据来自于 CRSP 数据库，样本期间为 1942 年 1 月至 1999 年 12 
月，共 696 个观 测值. 令 r t = ( r u , , r &t y 为具有递减的剩余期限的收益率序列. 
图士 4 给出了同样尺寸的的时间图 . 1年债券收益率的可变性远远小于较长期 
限的收益率的可变性.数据的样本均值和标准差分别为 

( i = 10- 2 (0.43, 0.45,0.45,0.46, 0.44)'， 

& = 10' 2 (2.53,2.43,1.97, Ofl,0.53)’. 


300 第8章多元时间序列分析及其应用 


之间的动态关系非常弱，但是它们的同步相关却是统计显著的. 


*# 


—97() 年 (b) 


- 


#»• 


971 年 (c) 




970 年 (d) 




98( 

1970 年 («) 
9GO 


- 

'mrr. 






#8 


序列的同步相关矩阵为 
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Pn = 


1.00 0.98 
0.98 1.00 
0.92 0.91 
0.85 0.86 
0.63 0.64 


0.85 0.63 
0.86 0.64 
0.90 0.68 
1.00 0.82 
0.82 1.00 


0.92 

0.91 

1.00 

0.90 

0.68 


出现下列现象 开不奇怪: 


( a ) 序列有高度的同步相 关性； 

( b ) K 期债券之间的相关要 高丁短 期债券之间的相关. 

表心2给出了 q 的延迟为1处与延迟为2处的交叉相关矩阵以及相应的简 
化矩阵.绝大多数显著的交叉相关在延迟 i 处，而且5个收益序列看上去是交互 
相关的.另外，1年期债券收益率的延迟为1处与延迟为2处的样本 ACF 高于其 


他较长期限序列的相应延迟的 ACF . 


表8~2 美国政府偾券的5个指数的月简单收益率的祥本交叉-相关矩阵.时间段是1942 


年1月至1999年12月 


~ 腿 1 | 延迟 2~ 

交又相 关矩阵 

0.10 0.08 0.11 0.12 0.16 

0.10 0.08 0.12 0.14 0.17 

0.09 0.08 0.09 0.13 0.18 

0.14 0.12 0.15 0.14 0.22 

0.17 U.15 0.21 0.22 0.40 

0.01 0.00 0,00 — 0.03 0.03 

一 0.01 0.00 0.00 一 0.04 0.02 

0.01 0.01 0.01 — 0.02 0.07 

-0.02 -0.01 0.00 -0.04 0.07 

-0.02 0.00 0.02 0.02 0.22 

简化的交叉-相关矩阵 


*+ + + + +* 

十 + + + + 

十 + 十 + + 

+ + + + + 

.+ + + + +_ 



_ - 

. 

:： : 

—— —— +」 



8.1.4 多元混成检验 

Hosking (1980, 1981) 以及 Li 和 McLeod (1981) 已经把一元的 Ljung-Box 统 
计量 Q ( m ) 推广到了多元 情形. 对一个多元序列，检验统计量的零假设为: 
Pi = * • • = Pm = 0. 备择假设为:对某些 *• G {1， … , m }, Pi ^ 0. 这样，就利用 
这个统计量来检验向量序列 r , 没有自相关或交叉相关性.假定检验统计量具有如 
下形式 . , 

Qk ( m ) = T 2 J 2 (8.7) 

其中 r 为样本容量. A : 为的维数， tv ( A ) 是矩阵4的迹，即>1的对角线元素的 
和.在零假设以及一些正则条件下， Qjt ( m ) 渐近服从一个自由度为 Pm 的 x 2 分布. 
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注释： Q k { m ) 统计量可以根据样本交叉相关矩阵&改写，但是这种表示涉 
及 Kroueckei •积®与本幸附录 A 讨论的矩阵的向 量化. 利用这些算子，我们有 

Qk ( m ) = T 2 fj Po 1 )^. 

其中 b t = vec (/&;). Li 和 Mcleod (1981) 提出的检验统计量为 

Q:(m) (以 1 ® 

1=1 

它渐近等价于 Qk ( m ). □ 

对例 8.1 中的 IBM 股票与 S&P500 指数的二元月对数收益率应用 Qjb(m) 统 
计最，我们有 Q 2 ( l ) = 9.81, Q 2 (5) = 47.06, Q 2 (10) = 71.65. 根据自由度为4, 2() 和 
40的渐近 x 2 分布，可得到这些 Q 2 ( w ) 统计量的 P 值分别为(1.044, 0.001 和 0.002 
因此，混成检验进一步确认了在5%的显著性水平下该二元收益率序列存在序列依 
赖性.对于例 8.2 中债券指数的5元月简单收益率，我们有 Q a (5) = 1 065.63,与自 
由度为125的 x 2 分布相比较，它是高度显著的. 

Qk ( rn ) 统计量是对的前 m 个交叉相关矩阵的个联合检验.如果零假设 
被拒绝，那么我们必须对序列建立一个多元模型来研究序列分童之间的引导延迟 
关系.下面我们讨论一些简单的向童模型.它们在给多元金融时间序列的线性动态 
结构建模时很有用. 


8.2 向量自回归模型 


在给资产收益率建模时.一个简单有用的向量模型是向量自回归 (vector au ¬ 
toregressive , 简记为 VAR ) 模型. 称多元时间序列服从一个一阶的 VAR 过程， 
或者简单地称为 VAll ( l ), 如果它服从下面的模型 


n = 00 + + a <， (8.8) 

这里如是一个维向量，$是一个 fcxfc 矩阵，是一个序列不相关的随机向 
量序列，其均值为0,协方差矩阵为 S . 实际应用中，要求协方差矩阵 S 是正 定的; 
否则，可以简化 r t 的维数.文献中，通常假定是多元正态的. 

考虑二元情形[即 k = 2 f r t = (nttratY 且 ％ = ( oi tl o at y ]. 这时 VAR ( l ) 模型 
包含了下面两个 方程： 


ru = d>io + 少 un.t-i + 伞 i2”2,t— 1 + ax*, 
rat = 02o + 办 + ^22^2,t-i 4 - 吻， 




8.2 向量自回归模型 3 U 3 


其中步是中的第 ( i , j ) 个元素 . 是0。 的第/ 个元素.根据第一个方程，化 2 
表示的是在存在时， r lt 对 r 2 . ( _ i 的线性依赖.因此婀 2 为给定 nM 时， 
对 r lt 的条件效应.如果 =(), 那么 r u 并不依赖于而且模型表 
明 r lt 只依赖于它自己的过去值.类似地，如果 < f 2 , = 0,那么第二个方程表明了给 
定 r 2 . t - i 时， r 2t 并不依赖于 

联合考虑这两个方程.如果知= 0,但是知# 0,那么从 nt 到 r 2t 有一个单 
向关系.如果^, 2 = = 0,那么 r 1( t 与是分离的.如果办 2 _0,且步 21 癸0, 

那么这两个序列之间有一个反馈关系. 

8.2.1 简化形式和结构形式 

一般地， (8.8) 式的系数矩阵中度量了 r t 的动态相依性 . r lt 与 r 2t 之间的同步 
关系可以通过 a , 的自协方差矩阵1：的非对角线元素(7 12 来反映.如果 ( r 12 = 0,那 
么这两个分量序列之间没有同步线性关系.在计量经济文献中， (8.8) 式中的 VAR ( l ) 
模型称为简化形式的模型，因为它没有清楚地给出分量序列之间的同步相依性.如 
果有必要，我们可以通过对简化形式的模型作一个简单的线性变换得到包含同步关 
系的一个显式表达.因为是 m 定的.所以存在一个对角线上元素全为1的下三 
角矩阵 L 以及对角矩阵 G 满足5： = LGT ： 参见附录 A 中的 Cholnsky 分解因 
此， L ~ 1 5：( i / )~ 1 = G . 

定义 b t ， （& lt ，_.. ， 6 fct )' — i -、 ，则 

E{b t ) = L^ECat) =0, Cov(d t ) = L^iL- 1 ) 1 = /广 1 = G. 

因为 G 是对角矩阵，所以私的分量是不相关的.在 (8.8) 式中的两端同时左乘 
L ~\ 我们得到 

L~ l rt = + = </»o + + b t , (8.9) 

其中％ =广 1 知是一个 A ： 维向量.而且轳=是 Jfcx fc 矩阵因为这个特 
殊的矩阵结构， IT 1 的第 A ： 行具有形式(咖，⑽，…因此，模型 (8.9) 
的第个方程为 


rkt + w>fc»r« = -f ^2 ^ki r i,t-x + fefcti (8.10) 

i=l «=l 

这里叹 0 是％的第 A ; 个元素，伞 L 是争 • 的第 （ fc ， i ) 个 元素. 因为对 1 彡 i < fc , 
b kt 与 b; t 是不相关的，所以 (8.10) 式明确给出了 nw 对~的同沙线性依赖性.其 
中1彡 i < A ; - 1. 在计量经济文献中，该式称为 r fc< 的一 个结构方程. 

对 n 的任何其他分量我们可以对 VAR ( l ) 模型进行重排，使得变为 
r t 的最后一个分量.可以利用前面的变换方法来得到~的一个结构方程.因此, 
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(8.8) 式的简化形式的模型等价于计童文献中使用的结构形式.在时间序列分析中, 
通常使用简化形式的模型，原因有 两个： 第一个原因是易于 估计; 第二个,也是主要 
的原因，是在预测时不能用同步相关性. 

例 8 . 3 为了说明从简化形式模型到结构方程的变换，考虑二元 AR (1) 模型 


rit 

_ 

0.2 

+ 

0.2 

0.3 


7*1,t-i 

+ 

ait 

m r 2 t 


0.4 


-0.6 

1.1 




0-2t 


对这个特殊的自协方差矩阵 S ， 下三角矩阵 




_ 1.0 0.0 
-0.5 1.0 

给出了一个 Cholesky 分解（即 L _ I S ( I /) -1 是一个对角阵).将前面的二元 AR (1) 
模型左乘上因子 IT 1 ，我们得到 


1.0 

0.0 


nt 


0.2 


0.2 

0.3 

0.5 

1.0 


T2t 


0.3 

十 

-0.7 

0.95 




bu 

f>2t 


[ 0 0.5 J 

这里 G = Cov ( b t ). 这个变换模型的第二个方程为 


r-n — 0.3 + 0.5ri< — 0.7ri,t_i + 0.95T2,t-i + lf2t 

该方程明确给出了 对 nt 的线性依赖. 

重新安排 r t 中元素的顺序.则二元 AR (1) 模型变为 


T2t 

rit 


0.4 

0.2 


1.1 - 0.6 
0.3 0.2 


r 2 ， t- 

n.t- 


0>2t 

«lt 


在 S 的 Cholesky 分解中需要的下三角矩阵变为 


1.0 0.0 

- 1.0 1.0 


将前面重排的 VAR ( l ) 模型前乘以 L ~\ 我们得到 


1.0 0.0 

1.0 1.0 


rit 


0.4 

- 0.2 


- 0.6 1.1 

- 0.8 0.8 


r 2,t- 


G 
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其中 G = Cov ( ct ). 现在第二个方程给出 

t*u = —0.2 -f- 1.0r*2f — 0 . 87 * 2 , 4—1 -4*0.8ri t t_i -1- C2t- 

这个方程再一次明确给出了 r lt 对的同步线性依赖性. 

8.2.2 VAR ( l ) 模型的平稳性条件和矩 

假定 (8.8) 式中的 VAR ( l ) 模型是弱平稳的.对这个模型取期望,利用 E ( a t ) = 
0 , 我们得到 


E(r t ) ~ 4>o + ^E(r t -x). 

因为 E ( r t ) 不随时间变化，假定矩阵/-^是非奇异的，则我们有 
M = E(r t ) = (/-^)-V 0l 


其中 r 是 fc x fc 单位矩阵. 

利用 KI — 由)/■*，则 （8.8) 式中的 VAR ( l ) 模型可以写为 

{rt — M) = 金 (n-i -ti) + a t . 

令 h = n - //是均值修正的时间序列，则 VAR ( l ) 模型变为 

f t = ^r t _n-o t . (8.11) 

这个模型可以用来推导出 VAR ( l ) 模型的性质.通过重复迭代，我们可以将 (8.11) 
式改写为 

r t = a t I -i I # 2 a t _ 2 + 金 3 a t _ 3 H - • 

这个表示给出了 VAR ( l ) 过程的几个 特征. 第一，因为 at 是序列无关的，从而 
Covh . m ) = 0. 事实上，对所有的 f > 0 , 与 n — ,都是不相关的.由于这个原 
因 .将〜 称为序列在时刻 i 的一个扰动或新息.可以证明，同一元的情形类似，对 
所有的时间序列模型，％与过去值 r t .,U > 0) 是不相关的.第二，将这个表示右乘 
以后取期望，并利用过程 a < 的不相关性，我们得到 Coy ^ Of ) = E . 第三，对 
于一个 VAR ( l ) 模型， rv 以系数矩阵中〃依赖于过去的信息 a t _ j . 为了这种相依性 
有意义，当 j oo 时，少〃必须收敛到 0. 这意味着中的 it 个特征值的模必须都小 
于1;否则，当 j — oo 时，舻要么发散，要么会收敛到一个不为0的矩阵，事实上, 
如果假定叫的自协方差矩阵存在，那么要求办的所有特征值的模都小于1，这正 
是 r t 弱平稳的充分必要条件.注意到对一元 AR (1) 情形，这个平稳性条件简化为 
|^| < 1. 另外，因为 
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故伞 的特征根是行列式 |J - 中 B | 的零点的倒数.因此 7t 平稳的一个等价的充要 
条件是行列式 mB )\ 的所有零点的模都大于1，即 | 中 ( b ) i 的所有零点在复平面上 
都位于单位圆外.第四，利用这个表示.我们有 

OQ 

Cov(r t ) = r 0 = S + 少 S 中 ’ + # 2 S($ 2 ) / + ... = E F S ( 妒 ) ' 

i =：0 

其中中 0 = /, BP it - x it 单位阵. 

将 （8.11) 式两端右乘以 〆 后取期望，并利用对干 j > 0,有 Cov(« t ,re ,) = 
EhfU ,) = 0的结果，我们得到 

E(f t f；_ r ) = ^ECn.xfU), / >0. 

因此 

r , = ^ r ( _! i > o , (8.12) 

其中 A 是^的延迟为 j 的交叉协方差矩阵.这个结果又是一元 AR (1) 过程的 
一个推广. 

通过重复迭代， (8.12) 式 表明： 

r ； = ^ ; r 0 , i > o. 

在 （8.12) 式两端分别左乘 D ~ 1 / 2 再右乘 D - V 2 可以得到 

p, = D 1 / 2 ^r,_ 1 D ~ ,/2 = D-^^D^^D^Ti-iD-^ 2 = Tp,_ lt 
其中 T = £ T 1 / 2 中£>" 2 .因此 VAR ( l ) 模型的 CCM 满足 
Pi = I > 0 . 

8.2.3 向量 AR ( p ) 模型 

VAR ( l ) 模型可以直接推广到 VAR ( p ) 模型.称时间序列 n 服从个 VAR ( p ) 
模型，如果它满足 

»*t = 00 + ^ir t _j -f ••• + ^ p r t _p + a t , p > 0 ， (8.13) 

其中 与叫 如前所 定义. 矩阵.利用向后推移算于 fl ， VAH ( p ) 模型 
可以写为 

(/ - J3 - ^ p B p )rt = <^> 0 + a t , 

其中 J 是 A : x A : 单位矩阵.这个表示可以写为一个更紧凑的形式 


•P(B)r t = 0 o + a t , 
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其中- 4 f v Bv 是一个矩阵多项式.如果 r , 是弱平稳的，并假 

定逆存在，则我们有 

M = E(r<) = (/- ^1 - ^ P ) _1 0o = [^(l)] _1 0o- 

令 h = r t - /!，则 VAR ( p ) 模型变为 

—1 = + ... + 中 p—t-p + at. (8.14) 

利用这个方程以及弓对 VAR ( l ) 模型同样的方法，我们得到 

• Cov ( r t , Of ) = E , E 是 a , 的协方差矩阵； 

• Cov ( r t _^, at ) = 0 ，I > 0; 

• r < = • • * + ^ P r /_ P , i > o . 

最后一个性质称为 VAR ( p ) 模型的矩方程.它是一兀 AR ( p ) 模型的 Y - W 方程 ( Yule - 
Walker equation ) 的多元形式.用 CCM 表示，则矩方程变为 

Pi iP/-i + • • • + "^pPi-pj l > 0 - 
其中 Ti = D ^ iD x f \ 

理解 （8.13) 式的这个 VAR ( p ) 模型性质的一个简单方法是利用 （8.8) 式中 
VAR ⑴模型的结果，可以通过将的 VAR ( p ) 模型变换为一个 Ap 元的 VAR ( l ) 
模型 得到. 具体地，令 ** =( f ；_ P +1 , f ；_ p + a ,..., r / t r ， b , = (0,... , Q , a[Y 为两个 k P 
维的过程，的均值是0,自协方差矩阵是一个 ibp x 知矩阵,只有右下角的元素不 
为0,用: E 表示.这样，关于 r , 的 VARC / i ) 模型可写成 

+ b tl (8.15) 

其中 V 是一个 fcp x Jfcp 矩阵： 

0 I o 0 o' 

0 0 I 0.0 

: : : : : 

0 0 0 0 … J 

-龟 P ^ p -1 电 p —2 中 p _3 ^1 

这里0与 J 分别是 x fr 零矩阵和单位矩阵.文献中称伞 • 为矩阵多项式少 ( B ) 的 
伴随矩阵 (companion matrix ). 

(8.15) 式是关于心的一个 VAR ( l ) 模型，它包含了 r t 作为它的最后 it 个分量. 
现在可以通过 （8.15) 式用上一小节中给出的 VAR ( l ) 模型的结果来推导 VAR ( p ) 
模型的 性质. 例如，由定义，而是弱平稳的当且仅当 r t 是弱平 稳的. 因此， (8.13) 
式中 VAR ( p ) 模型弱平稳的充要条件是 (8.15) 式中伞 • 的所有特征值的模都小于 
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1. 类似于 VAR ( l ) 模型，可以证明该条件等价于行列式 \^( D )\ 的所有根都在单位 
圆外. 

在金融时间序列分析中特别关心的是 VAR ( p ) 模型的系数矩阵私的结构.例 
如，如果对所有的 Z ,化的第 （ i , j ) 个元素 ^(0 都是0,则〜不依赖于以的过 
去值.这样，系数 矩阵％ 的结构给出了 的分量之间的引导-延迟关系的信息. 

8.2.4 建立一个 VAR ( p ) 模型 

我们继续利用定阶、估计以及模型检验这样一个迭代程序来对给定的时间序 
列建立一个向量 AR 模型.一元序列 PACF(partial autocorrelation function , 偏自 
相关函数)的概念可以推广到多元情形并用来识别向量序列的阶 P . 考虑下面的相 
邻的 VAR 模型： 

rt = 4> 0 + ^in-i +o t? 

rt = < f>o + 企 2 r < 一 2 + a t , 


r «： = 冷 D + 办 i r t-i + … + ^« r t-< + a c ， (8.16) 


这些模 M 的参数可以通过普通最小二乘方法 (the ordinary least squares , 简称 OLS ) 来 
估计.这在多元统计分析中称为多元线性回归估计.参见 Johnson 和 Wichcrn (1998). 

对于 （8.16) 式的第 i 个方程.令4^表示％的 OLS 估计，说）表示％的估 
计，这里上标 （ i ) 用来表示估计是针对 VAR ( i ) 模型的，则残差为 

df = r e - <t>o - -“ 

对 i = 0, 残差定义为 fP = 7 这里 f 为 n 的样本均值.残差的自协方差矩阵 
定义为 T 

T _ l 2i _ x E #(#)' i > 0 . (8.17) 

为了确定阶 P , 可以对 Z = 1,2，... 依次检验零假设屯= 0对备择假设札： 
屯/ 0 . 例如，利用 (8.16) 式中第一个方程，我们可以检验零假设:婀， 0, 与 
备择假设 H a ^ l 7 ^ 0 . 检验统计量为 

«(,) = -to gij), 

其中么的定义见 （8.17) 式， | A | 表示矩阵>1的行列式.在一些正则性条件下，检 
验统计童 M ⑴ 渐近服从自由度为 P 的 X 2 分布（参见 Tiao 和 Box (1981)). 








8.2 向量自回归模型 309 


一般地，我们利用 (8.16) 式中的第 i 个和第 i - 1 个方程来检验= 0 
对戌•.屯 一 0, 也就是说检验一个 VAR ( i ) 模型对一个 VAR(t - 1) 模型.检验统 
计量为 

M ⑴一卜昼) m (蟲) . (8.18) 

M { i ) 渐近服从自由度为 A ; 2 的 x 2 分布. 

另种选择是利用 AIC(Akaike information criterion ) 或它的变形来选择阶 p . 
假定 a t 是多元正态的，并考虑 (8.16) 式屮的笫/:个方程，可以用最大似然 （ maxi - 
inum likelihood , 简称 ML ) 力法来估计这个 模型. 对于 AH 模型， 0 LS 估计 < 和 
七等价于（条件) ML 估计. 然而， S 的估计之间有所区别. S 的 ML 估计为 

^ = 1 ^ d ^[ a ^ r . (8.19) 

t=i^i 

VAR ( i ) 模型在止态假定卜的 AIC 定义为 

AIC(i)-ln(fel) + 爭 . 

对一个给定的向量时间序列,可以选择 AR 的阶 R 使它满足 AIC ( p ) = mm AIC ( i ), 
其中是一个预先指定的正整数. 

对于 VAR ( i ) 模型其他可用的信息准则有 

BIC ⑷ + 

HQ ( i ) = ln ( fel ) + ^ yr )) 

HQ 准则是由 Hanuan 和 Quinn (1979) 年提出的. 

例 8.4 ，定例 8.1 中讨论的由 IBM 股票和 S & P 500 指数的月对数收益率所 
构成的二元序列服从一个 VAR 模型，我们对数据利用 Af ⑷统计量和 AIC . 表 
给出了这些统计量 的值. 两个统计量都表明 VAR (3) 模型对数据可能是充分的.在 
5%水平下， Af ( i ) 统计量在延迟1， 3 , 5 处都是边际显著的 . AIC 的最小值在阶3处 
出现.对这个特例， M ( i ) 统计置在1%水平下是不显著的，从而证实了前面的观测： 
两个收益率序列之间的动态序列相依性很弱. 


表8~3 IBM 般第和 S & P 500 指数的月对数收益牟的定阶统计置, 
时间区间从1926年1月到1999年12月 a 


阶 

1 2 

3 

4 

5 

6 

M ( t ) 

AIC 

0.81 8.03 

6.757 6.756 

12.57 

7.750 

0,08 

6.753 

9.56 

6.751 

2.80 

6.756 


a 自由度为4的卡方分布的5%和1%临界值分别为 9.5 和 1 .U 
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估计和模型检验 

对子一个指定的 VAR 模型.可以利用普通最小二乘法或最大似然方法来估计 
参数.这两个方法是渐近等价的.在一些正则性条件下，估计是渐近正态的.参见 
Rcinscl (1993). 应该对所拟合模型的任何可能存在的不充分性进行仔细检验.可以 
对残差序列利用 Q k ( m ) 统计量来检验残差之间没有序列相关或交叉相关的假定. 
对一个拟合的 VAR ( p ) 模型，残差的 Q k ( m ) 统计量渐近服从自由度为 Pm - 分的 
X 2 分布，这里 . y 为 AR 系数矩阵中待估参数的个数. 

例 8.4( 续）表 8-4a 给出了对丁 • IBM 股票和 S& P500 指数的月对数收益率所构 
成的二元序列拟合 VAR(3) 模型时的估计结果，具体指定的模型以下面的形式给 
出： 

rt =沴。+ 伞 i r t-i + + o ， i , (8.20) 

其中 r , 的第一分量表示 tBM 股票的收益率.对这个特例，我们仅仅使用了延迟1 
和延迟3的 AR 系数矩阵，这是因为数据之间的弱序列相 关性. 一般地，当 M { i ) 
统计量和 AIC 准则指定一个 VAR (3) 模型时，应该使用所有的3个 AR 延迟.表 
8-4b 给出了估计结果.在该结果中己经将一些统计上不显著的参数设置为 0 .另 
外，表 8-4b 给出了所拟合模型的残差序列的 Q fc (m) 统计量值为仏⑷= 18.17, 
Q 2 (8) = 41.26. 因为拟合的 VAR(3) 模型在 AR 系数矩阵中具有 4 个参数，所以这 
两个 Q fc ( m ) 统计量分别渐近服从_由度为12和28的 x 2 分布.检验的 p 值分别 
为 0.111 和 0.051, 因此在 5% 的显著性水平下，模型是充分的.如同一元分析中显 
示的，收益率序列很可能貝有条件异方差性.我们在第10章中将讨论多元波动率 


表 8-4 对由 IBM 股票和标准普尔500指数的月对数收益率拟合 VAR .(3) 模型时的估计 
结果，时间区间从1926年1月到1999年12月 

#» | 00 | | »3 1 S 


( a ) 整个模锻 








估计值 


0 0.117 

0 -0.083 



0.57 

0 0.073 

0 0.109 


标准差 

0.23 

0.040 

0.040 



0 19 

0.033 

0.033 

L_ 


从表 8-4b 中拟合的模型，我们观测到 ： （a) 两个新息序列之间的冋步相关系数 
为 23.51/>/44.48 x 31.29 = 0.63, 如所料想，它很接近于 r l£ 与 〜 之间的样本相关 
系数； （b) 两个对数收益率序列具有正的显著的均值，蕴涵 f 两个序列的对数价格 
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在该数据范围内具有上升 趋势； （ c ) 这个模型表明 


IBM t = 1.24 + 0.117 SP 5 t _ i - 0.083 SP 5 t _ 3 + a lt , 
SP 5 t = 0.57 4 - 0.073 SP 5 t _i - 0.109 SP 5 t _ 3 + a2t . 


因此在5%显著水平下从 S & P 500 指数的月收益率到 IBM 的月收益率有一个单向 
动态 关系. 如果 S & P 500 指数代表美国股票市场.则 IBM 收益率将受该市场过去 
运动的影响.然而，即使两个收益率有实质上的同步相关性， IBM 股票收益率的过 
去运动也并不显著地影响美国股票市场.最后，拟合的模型可以写为 


• IBM t 
SP 5 t 

= 

’ 1.24 _ 
0.57 

+ 

• 0.117 
0.073 

SP 5 t _ t - 

• 0.083 
0.109 


这表不 SP 5 t 是该二兀序列的驱动因子 (driven factor ). 

预测 


ait 

a2t 


将合理建立的模型看作是真实的模型，则可以应用一元分析中同样的方法来进 
行预测并得到相应预测误差^标准差.对一个 VAR ( p ) 模型，以 /». 为预测原点的1 
步向前预测为相应的预测误差为以⑴=叫 +1 .预测误 
差的协方差矩阵为 E . 对于南前两步预测，用 r h +1 的预测來代替 r h+1 即可得到 

P 

r h (2) =办 0 +办心⑴+ ^ 2 办心十 2 -“ 

»=1 

相应的预测误差为 


e / i (2) = ahi-2 + 中 i [ r t — r / t ( l )] = a^+2 + 金 ldfc + i . 

预测误差的协方差矩阵为 S +少 1 5：中' 1 .如果 7 *,是弱平稳的，则随着预测步长 Z 的 
增加，向前 Z 步预测 r h ( i ) 将收敛到均倌向量预测误差的协方差矩阵收敛到 rt 
的协方差矩阵. 

表给出了 IBM 股票和 S & P 500 指数月对数收益率（以百分比形式给出）的 
向前一步预测和向前六步预测的结果，预测原点为 A = 888. 预测是通过表8~4中 
改进后的 VAR (3) 模型得到的. 


表8>5对 IBM 股票和标准普尔500指数的月对数收益率（以百分比形式给出）利用所 
_拟合的 VAR (3) 模型进行预测的 结果： 预测原点是1999年12月 

步 长 1 + 2 3 4 5 6 

~出 M 的预测值 r40 132 082 h2l 

标准差 6.67 G.TO 6.70 6.72 

S&P 的预测侑 0.32 0.38 -0.02 0.63 

标准差 _5^_^61_ 5.61 5.64 



6.64 5.64 
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总之，建立一个 VAR 模型涉及三个步骤： （ a ) 利用检验统计量 M ( i ) 或某种信 
息准则定阶 Ub ) 利用最小二乘法估计指定的模型，如有必要,可以通过消除统计上 
不显著的参数来東新估计这个 模型; （ c ) 利用残差的 Q k { m ) 统计量来检验拟合模型 
的充分性.残差序列的其他特征，如条件异方差和异常值，也可以检验.如果拟合 
的模型是充分的，则可以用它来进行预测并对变量之间的动态关系作推断. 

本小节用 SCA 进行 分析. 所用的命令包括 miden, mtsm, mest 和 mfore ， 其 
中前缀 m 表示 多元. 下面给出了命令和输出结果的细节. 


SCA 演示 


输出 结果， 其中“％”表示注释. 

input ibm,sp5. file # m-ibmspln,txt # 

—% Order selection 
miden ibm,spb. no ccra. arfits l to 6. 

TIME PERIOD ANALYZED.1 TO 888 

SERIES NAME MEAN STD. ERROR 

1 IBM 1.2402 6.7249 

2 SP5 0.S372 5.6415 

==«»==== STEPWISE AUTOREGRESSION SUMMARY ====== 


X 

LAG I 


RESIDUAL T 
VARIANCESI 


RIGENVAL•I CHI-SQ I 
OF SIGMA I TEST I AIC 


I SIGN. 
I 


447E+02 I 
.310F.+O2 T 


135E^02 I 
629E+02 I 


9.81 I 


2 1 
I 


443E+02 I 
317E+02 I 


135E+02 I 
625E+02 I 


8.93 I 
I 


,756 


3 1 
I 


441E+02 I 
•313E+02 I 


134E+02 I 12.57 I 
619E+02 I I 


6.750 


441E+02 I 
•312E+02 I 


133E+02 I 
619E+02 I 


6.08 I 
I 


6.753 


5 1 
I 


437E+02 I 
•309E+02 I 


133E+02 I 
613E+02 I 


9.56 I 
I 


6.751 


6 1 
X 


437E+02 I 
.308E«02 I 


133E+02 I 
613E+02 I 


2.80 I 
I 


CHI-SQUARED CRITICAL VALUES WITH 4 DEGREES OF FREEDOM ARE 
5 PERCENT : 1 PERCENT : 13.3 

-- % Specify a VAR(3) model with lags 1 & 3 only, 
mtsm fitl. series ibm, sp5. @ 
model (i-pl*b-p3*b**3}series=c+noise. 



















8.2 向量自回归模型 




SUMMARY FOR MULTIVARIATE ARMA MODEL -- FIT1 

PARAMETER FACTOR ORDER CONSTRAINT 

1 C CONSTANT 0 CC 

2 PI REG AR 1 CPI 

3 P3 REG AR 3 CP3 

-- % Perform multivariate estimation 

mestira fitl. hold resi(rl.r2) 

- CONSTANT VECTOR (STD ERROR) - 

1.201 ( 0.232 ) 

0.583 ( 0.194 ) 

- PHI MATRICBS - 

ESTIMATES OF PHI(1) MATRIX AND SIGNIFICANCE 
.011 .106 . + 

-.013 .084 .. 

STANDARD ERRORS 
.043 .051 

.036 .043 

ESTIMATES OP PHI(3) MATRIX AND SIGNIFICANCE 
.039 -.112 .- 

-.007 -.105 .- 

STANDARD ERRORS 

.044 .052 

.037 .044 


ERROR COVARIANCK MATRIX 
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0.566 ( 

0.190 

> 


- PHI MATRICES -- 

— 


ESTIMATES OF 

PHI (1) 

MATRIX AND 

SIGNIFICANCE 

.000 

• 117 



.000 

.073 

• + 


STANDARD ERRORS 



-- 

.040 



一 

.033 



ESTIMATES OF 

PHI (3) 

MATRIX AND 

SIGNIFICANCE 

.000 

•.083 

• 曹 


.000 

-•109 

. - 


STANDARD ERRORS 



• — 

.040 



一 

• 033 




ERROR COVARIANCE MATRIX 


1 2 

1 44.482888 

2 23.506951 31.293592 

--% Compute residual CCM 

miden rl # r2. maxi 12. 

-- % Produce 1 to 6-step ahead forecasts 
mfore fitl. nofs 6. 

8.2.5 脉冲响应函数 

类似于一元情形，一个 VAR( P ) 模型可以表示为过去新息的线性函数.即 

r t ‘ /x 十 a t + 少十 -2 + …， (8-21) 

其中， p =[少⑴]— 1 ‘这里假定金⑴的逆存在，系数矩阵中，可以由与下式中汉 
的系数相等 得到： 

-(/ 十中 iZ ? + ^f 2 B 2 十… ） =/， 

其中 J 为单位矩阵.这是 n 的滑动平均表示，其中系数矩阵*,为过去新息免一< 
对 tv 的影响.等价地，中，也是 a t 对未来观测 tvh 的影响 • 因此通常称中，为 r t 
的脉冲响应函数.然而，由于的分量通常是相关的，所以对 （8.21) 式中屯，分 
置的解释不是很官观.为了帮助解释，我们可利用前面的 Cholesky 分解对新息进 
行变换，使得变换后的新息的分量不再相关.具体地，存在一个下三角矩阵 L 满 
足 E = LGL \ 其中 G 为对角阵 ft 1的对角线元素均为 1( 参见 （8.9) 式).令 
b t = ITL,, 则 Cov(5 t ) = 因此分量6#是不相 关的. (8.21) 式可以改写为 

rt = fjt + at -f ^2 a f-2 十 •" 

= LL" { at + ^\LL~ 1 at-i + ^2^L la t-2 + … 

= /x + 伞二 bt + ^ Fibt^i 4 -屯; 一 2 + …， （8.22) 
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其中屯；;= I , f = 中乂. 系数矩阵中；称为 n 的带 m 交新息 b t 的脉冲响应函数. 
特别地 .中, •的第 （ i , j ) 元 屯聰是 b jt 对未来观测 r M + , 的 影响. 在实际中，可以进 
—步将 TH 交的新息匕标准化，使得 6 it 的方差为1_上述正交化的一个弱点是结果 
依赖于 n 中分量的顺序特别地 T & u = a lt ， 从而 au 并没有作变换 . r , 分量的不同 
排序会导致不同的脉冲响应函数. 

SCA 和 S-rius 都可以得到所拟合 VAR 模型的脉冲响应函数.为了演示 S-Plus 
中 VAR 模型的分析，我们仍然用例 8.1 中 IBM 股票和 S&P500 指数的月对数收益 
率的数据.关于 S-Plus 命令的细节，可参见 Zivot 和 Wang(2003). 

S - Plus 演示 

输山结果. 

> x-matrix(acan(file- , m ibmspln.txt*),2) % Load data 

> ibm=x[1,] 

> sp5=x!2 J 

> y=cbind{ibm,sp5) % Create a vector series 

> yl=data.frame (y) % create a data frame 

> ord.choice=VAR(yl,max.ar=6) % order selection 

> ord.choice$info 

ar(l) ar(2) ar(3) ar(4) ar{5) ar(6) 

Die 10998.47 11016.61 11031.07 11052.05 11069.49 11093.78 

> ord.choice=VAR(yl,max.ar=6,criterion= * AIC*) 

> ord.choice$info 

ar(l} ar(2) ar(3) ar(4) ar(5) ar(6) 

AIC 10969.70 10968.79 10964.11 10965.97 10964.28 10969.44 

AIC 跟以前一样选择了 VAR(3) 模型，而 BIC 选择了 VAR ⑴模型.为简单起 
见.我们在演示中用 VAR(l) 模型. 注意到在两个程序包中用到了不同的标准化方 
法，因此信息准则的值是不同的，可参见表 8 -3 中的 AIC. 这并不重要，因为标准化 
并不影响阶的选择，下面转向估计. 

> varl.fit=VAR(y-ar(1)) % Estimation 

> summary(varl.fit) 

Call* 

VAR(formula = y ~ ar(1)) 

Coefficients : 

ibm spb 
(Intercept) 1.1627 0.4993 

(etd.err) 0.229(3 0.1925 

(t.Stat) 5.0777 2.5935 

ibm.lagl 0.0192 -0.0054 
(std.err) 0.0433 0.0364 

(t.Stat) 0.4429 -0.1487 

sp5.1agl 0.1062 0.0802 

(std.err) 0.0517 0.0435 
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(t.Stat) 2.0544 1.8454 

Regression Diagnostics： 

Ibm sp5 
R-squared 0.0105 0.0058 
Adj. R-squared 0.0082 0.0036 
Resid. Scale 6.7043 5.6376 

> plot(varl.fit) 

Make a plot selection (or 0 to exit) : 

Is plot： All 

2; plot : Response and Pitted Values 
3 : plot : Residuals 

8: plot： PACF of Squared Residuals 
Selectiont 3 

所拟合的模型是 

D3Mt = 1.1.6+ 0.02IDM t -i +0.1 lSP5 t _i +a lt ， 

SP5* = 0.50 0.01IBM f _i I O.OSSPSt-i I a 2t . 

基于输出结果中估计的 f 统计量的值，在两个方程中都只有延迟变量 SP 5*.! 是显 
著的.图心5给出了两个残差序列的时间序列图.两条水平线表示两倍的标准误差 
上下限.如所料想，取值为异常值的观测存在聚集现象. 

残差与时间 



-3() 


(I 200 40U G00 8U0 

图8>5 为 D 3 M 股票和 S & P 500 指数的 H 对数收益率（以百分比形式给出）所拟合的 VAR ( l ) 
模型残差的时间序列图，样本的时间区间从1926年1月到1999年12月 

接下来，我们计算所拟合 VAR ( l ) 模型的向前1步到向前6步预测以及脉冲 
响应函数，这里 IBM 股票的收益率是的第一个分量.与表8>5中的 VAR (3) 模 
型相比，用 VAR ⑴模型得到的预测更快地收敛到序列的样本均值. 
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> varl.pred=predict(varl.fit,n.predict=6> % Compute prediction 

> summary(varl.pred) 

Predicted Values with Standard Errors : 
ibm sp5 

1- step-ahead 1.8472 0.9255 

(std.err) 6.7043 5.6376 

2- step-ahead 1.2964 0.5636 

(std.err) 6.7394 5.6539 

3- step-ahead 1.2474 0.5375 

(std.err) 6.7397 5.6540 

6-step-ahead 1.2434 0.5356 
(std.err) 6.7397 5.6540 

> plot(varl.pred,y, n.old=i2) % Plot forecasts 

> varl•irf=impRes(varl.fit,period-6,std.err= * asymptotic*) 

> summary(varl.irf] 

Impulse Response Function ： 


(with responses in rows, and innovations in columns) 
# « lag.O 

ibm sp5 
ibm 6.6929 0.0000 
(std.err) 0.1589 0.0000 


sp5 
(std.err) 
,, lag.1 


ibm 

(std.err) 

sp5 

(std.err) 


3.5645 4.3553 
0.1690 0.1034 


ibm apS 
0.5069 0.4624 
0.2244 0.2249 
0.2496 0.3492 
0.1885 0.1891 


> plot(varl.irf) 

图给出了最后 12 个数据点的点预测和置信水平为95%的预测区间.图 
8-7 给出了所拟合 VAR(l) 模型脉冲响应的函数图，这里 IBM 股票的收益率是 r t 
的第一个分量_由于收益率序列的动态相依性很弱，从而脉冲响应函数展现出简单 
的形式，并且快速地衰减. 

8.3 向量滑动平均模型 

—个阶为《的向量滑动平均模型 （ VMA ⑷ 模型）具有形式 

=0。+ 叫 - © Wi-i - © f / a t _ 9 或 r t = + Q ( B ) a t , (8.23) 

其中0 0 是 A : 维向量 . 0,是 Arx A : 矩阵， ©( B ) = /-©,5 -0,^是向后推 

移算子 B 的 MA 矩阵多项式.类似于一元的情形，假定 a , 的协方差矩阵 S 存在, 
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步数 


m 8-7 为 IBM 股票和 S & P 500 指数的月对数收益率（以百分比形式给出）所拟合的 
VAR ( l ) 模型的正交新息的脉冲响应函数图，样本的时间区间从1926年1月 
到1999年12月 


则 VUA ( q ) 过程是弱平稳的.将 (8.23) 式取期望，得到 m = E ( r t ) = 0 n . 这样，对 
VMA 模型而言，常数向量是的均倌向暈. 

880 885 89() 



图士6 利用为 IDM 股栗和 3& P 500 指数的月对数收益率（以百分比形式给出）所拟合的 
VAR ( l ) 模型进行预测的预测图，枰本的时间区间从1926年1月到1999年12月 




$s 
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令= rt - 0 (1 为均值修正的 VAR ( g ) 过程.那么利用 (8.23) 式以及是 
序列不相关的事实.我 们有： 

(1) Cov ( r t , a t ) = 53; 

(2) r 0 = E + ©iS ©； + ... + 

(3) 若 Z > 9 ,则 r t = 0; 

(4) 苕 i 矣 r < 沁则 r < = x ： 0jS©；_ tl 其中 ©(, = -/• 

J =^ 

因为对于 ！ > (7, 有 = 0,所以 VMA ⑷过程 n 的交叉相关矩阵 ( CCM ) 满足 

Pi = 0, I > q. (8.24) 

因此，类似于一元情形，可以利用样本 CCM 来识别一个 VMA 过程的阶. 

为了更好地理解 VMA 过程，让我们考虑二元 MA (1) 模型. 

rt = + a* - ©at-x = // + a t - ©o^!, (8.25) 

这里为了简便，消除了 的下标.这个模型可以清楚地写为 


ru 



十 

an 


' 0U 

012 


_ rat 




^2t 


^2i 

022 

a 2,t-l 


它说明当前的收益率 r t 仅仅依赖于当前的和过去的扰动.因此，这个模型是一个 
有限记忆模型. 

考虑 （8.26) 式中〜所满足的方程，参数0 12 表示 a 1| t _! 存在时， r u 对 
的线性 依赖. 如果= 0,则并不依赖于 a 2 t 的延迟值，因此也不依赖于 r 2t 
的延 迟值. 类似地，如果 0 21 = 0,那么 r 2 t 并不依赖于 r it 的过去值 .© 的非对角 
元素反映了分童序列之间的动态依赖性.对这个简单的 VMA(l) 模型，我们可以将 
与 r 2 , 之间的关系分类如下. 

(1) 如果 e 12 = 021 =0,则它们是分离的序列. 

( 2 ) 如果= 0，但 Q 21 / 0，则从 ru 到 r 2 t 有一个申向动态关系.如果 
g 21 = 0,但 e 12 # 0,则相反的申-向动态关系成立. 

⑶如果/ 0,且 e 21 # 0,则 r lt 与 r 2 t 之间有一个反馈关系. 

最后，〜之间的同步关系与叫之间的同步犬系是一样的.前面的分类可以推 
广到 VMA( 9 ) 模型. 

估计 


与 VAR 模型不同， VMA 模型的估计更加复杂.具体可参见 Hillmer 和 Tiao 
(197 9 ) 与 LutkepoW (1991) 及其参考文献.对似然近似法，有两种方法可以利用. 
第一种方法是条件似然方法，它假定对于 * < 0,有= 0. 第二种方法是精确似然 
方法，它将/ < 0时的叫看作模型的一个附加参数.为了获得估计问题的一些洞 
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察，我们考虑 (8.25) 式中的 YMA ( l ) 模型.假定数据为 { r t | t = 1，...，77,且是 
多元正态的.对一个 VMA (1： 模型，这个数据依赖于 
条件 MLE 

条件似然方法假定 ao = 0. 在这个假定下，将模型改写为= r t -©o + © o t _ lt 
我们可以递推地计算有 

Ol = Tj — 00, Q>2 = T2 — 00 + ©lOj,. •. • 

因此，数据的似然函数变为 

/( 〜 •• ， rr\0u. ©t.S)=n (2jl )fc/2|S|i/2 exp 

并据此得到参数估计. 

精确 MLE 

对精确似然方法， a 0 是一个未知向置，为了计算似然函数，必须根据数据进行 
估计，为了简便，令= r t - 的为均值修正序列.利用与 （8.25) 式，我们有 

a t = ^ + 00^!. (8.27) 

通过重复迭代，与所 有的匕 都相关，因为 
oi = fi + ©ao, 

aa = f 2 -f Bnj = f a + Wfi + fi 2 a 0l (8.28) 


or = + ©rn +. — h Q 7 * -1 # 1 ! + © r a。. 

这样如果给定 © 和 6^ , 则 a ( , 是数据的线性函数.这个结果使得我们可以利用数 
据与以及0的初始值来估计 a 0 . 更具体地，给定00, 0与数据.我们可以定 
义： 

”二匕十©。—：！ +..• + ©*— 1 尹 t = , T . 

则 （8.28) 式可以改写为 

rj = —© a 0 + oi , 
rj = —© 2 ao + a ， 2i 


= —© r ao 4 - a*r. 

这是多元线性回归的形式，参数向量为 a 0 , 尽管 at 的自协差矩阵 S 町能小是一个 
对角阵.如果; E 的初始值也可以得到.则可以用 S 的平方根矩阵 5 T 1 / 2 左乘上面 
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系统中的每个方稈.结果由的系统真的是一个多元线性冋归 ， 且可以利用 OLS 方 
法来得到 oo 的一个估计，表示为 A 。. 

利用估 计心， 可以递推地计算扰动 at ， 因为 

= 7*1 — ©0 + © do , 02 = T 2 — + ® ai , • • • • 

该递推是从 （aow ，…， r r ) 到 (00,0,, , a T ) 的线性变换.我们可以从中得到 

和数据的联合分布.另外，我们也可以从 { o 4 |< = 0, •• , T } 的联合分布中通过求 
的积分来推出数据的精确似然函数.可以利用如此求得的似然函数来得到精确的 
ML 估计.具体细节参见 Hillmer 和 Tiao (1979). 

总之，精确似然方法的操作 如下： 给定 0 (1 . © 与 S 的初始佔计，利用 （8.28) 式 
导出的 估计. 利用 （8.27) 式，这个佔计又反过来可以用来递推地计算 a< 且初始 
值为 A = r t + 0 a o . 然后利用结果中的估计数据的精确似然函数，以便 
更新％,©和 E 的 估计. 重复整个过程直至估计收敛.估计精确似然函数的这个 
迭代方法对一般的 VMA ( q ) 模型也是适用的. 

由前面的讨论知，精确似然方法比条件似然方法要求更多精深的计算.但是它 
也提供了更精确的参数估计，尤其是当 e 的某些特征值的模接近于1时 . Hillmer 
和 Tiao (1979) 给出了 VMA 模型的条件似然估计与精确似然估计之间的一些比较. 
在多元时间序列分析中，如果怀疑数据可能过度差分，则精确最大似然方法变得尤 
其重要.过度差分可能在很多情况下发生， 例如， 协整系统中单个分最的差分（参见 
后面对协整的讨论). 

总之.建立一个 VMA 模型需要二个步骤： （ a ) 利用样本 交叉相 关矩阵识别阶 
n (因为，对 VMA ⑷模型，当/ > g 时，外= 0); ( b ) 利用条件似然方法或精确似然 
方法来估计指定的模型（当样本量不太大时，更喜欢用精确方 法)； （ c ) 应该检验所 
拟合模型的充分性（例如对残差序列利用 Q k ( m ) 统计量).最后，可以利用与一元 
MA 模型同样的程序得到 VMA 模型的预测. 

例 8 . 5 再次考虑由 IBM 股票和 S & P 500指数的月对数收益率（以百分比表示） 
所构成的二元序列，时间区间从1926年1月到1999年12月.因为显著的交叉相 
关主要 在延迟1和延迟 3 处发生，所以我们对数据采用了卜述 VMA (3) 模型： 

r t = i - © 3 at -3 (8.29) 

表给出了这个模型的估计 结果. 这个簡化模型残差的 Q k ( m ) 统计童值为 Q 2 (4) = 
17.25, Q 2 (8) = 39.30. 与自由度为12和28的 X 2 分布比较，这些估计量的 p 值分 
别是 0.140 4和 0.076 2. 因此，该模型在5%的显著水平下是充分的. 

由表8-6,我们作出以下观测. 

(1) 对这个特例，条件似然估计与精确似然估计的差别很小.这并不奇怪，因为 
样本量并不小，而且更重要的是数据的动态结构很弱. 
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(2) VMA(3) 模型对序列提供了与例 8.4 的 VAR(3) 模型同样的动态关系. IBM 
股票的月收益率依赖 S& P 500 指数过去的收益率.相反地，市场收益率并不依赖 
于 IBM 股票的过去收益率.换句话说，数据的动态结构是由市场收益率而并不是 
IBM 收益率驱动的，然而，两个收益率序列间的同步相关性仍很强. 


8.4 向量 ARMA 模型 


—元 ARMA 模型也可以推广到处理向量时间序列的情形.所得的模型称为 
VARMA 模型.然而，这种推广会遇到一些在 VMA 和 VAR 模型时不会出现的新 
问题.其中一个问题 是识别 问题.与一元 ARMA 模型不同， VARMA 模型并不是唯 
一定义的.例如, VMA(l) 模型 

ru = r «it 1 _ r 0 2 

r 2t [ 0,2t J [ o 0 a2,t-x 

与 VAR ⑴模型 



是相同的.这两个模型的等价性可以通过检査它们的分量模型很容易地看出.对 
VMA(l) 模型.我们有 


— 2o2,t-i, r2t — a2t- 


对这个 VAR(l) 模型，方程为 
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ru + 2r2,t_i = an, rzt = a.2t- 

由 r 2 t 所服从的模型，我们有 = a 2 . t _!. 因此所服从的模型是相同的.这 
种类型的识别问题并没有坏处，因为在实际应用中，两个模型都可以使用. 

另一种类型的识别问题比较麻烦.考虑 VARMA (1,1) 模型 



这两个模型对任何非零的 w 和7?是相同的.在这个特例中，等价性之所以成立是 
因为在两个模型中都有 r 2t = fl 2 t . 在第二个模型中，参数 u ; 和^对系统的 AR 部 
分和 MA 部分的影响互相抵消了.这一个识别问题是严重的，因为，如果没有恰当 
的限制，数据的向量 ARMA(1,1) 模型的似然函数并不是唯一定义的，从而导致了 
类似于回归分析中的精确多重共线性的问题.即使没有一个分量是白噪声序列，这 
种类型的识别问题也会发生. 

这两个例子引出了推广到 VARMA 模型时涉及的新问题.这样，对一个给定的 
数据集合建立 VARMA 模型要求注意一幽问题.许多时间序列的文献，已经提出 
了用结构指定 （structural specification ) 方法来克服这种识别问题.可参见 Tiao 和 
Tsay ( l <)89). Tsay (1991) 及其参考文献.我们这里并不讨论结构指定的细节，因为 
在大多数金融应用中， VAR 和 VMA 模型就足够了.当使用 VARMA 模型时，只关 
心低阶的模型（如 VARMA (1,1) 或 VARMA (2,1) 模型)，尤其是当涉及到的时间序 
列是非季节性模型时. 

VARMA(p, 9 ) 模型可以写成 

^{B)r t = 0。+ 0(B)a<, 

其屮伞 ( S ) -中 和 0( B ) = I - Q X B -是两个 kxk 

矩阵多项式.我们假定这两个矩阵多项式没有左公共因子，否则模型可以简化 . rt 
弱平稳的充要条件与具有矩阵多项式 *(S) 的 VAR(p) 模型是相同的.对 u > 0,系 
数矩阵中 ，，和 ©„ 的第 （ i, j) 个元素度量的分别是 r w 对 以 ― t , 和 a jtt - v 的线性依 
赖.如果对所有的 AR 和 MA 系数矩阵，都有第 （ i ， j) 个元素为0,则 7.,* 并不依赖 
于以的延迟值.然而，在 VARMA 模型中反过来并不 成立. 换句话说，即使并 
不依赖于的任何延迟值, AR 和 MA 矩阵的第 ( i , j ) 个位置也可以存在非0系 
数_ 

为了说明上述问题，考虑下面的二元模型 
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■ $n(fi) 1 T r u 1 = T e n (B) 0i 2 (B) 1 [ a» ' 

$21( 丑） $22(5) rot 021(B) ©22(B) a<2t 

这里从到 r 2< 存在单向动态关系的充要条件是 

争 22( S )0 12 ( B ) — ^1 2 ( B )0 22 ( B ) = 0, 

但是 

$ u (B)e 21 (5) - ^ 21 (B)Q n (B) ^ 0. (8.30) 

这些条件可以如下得到，令 


0( B ) = | 办(月)| 二 <& u ( B )^ 32 ( B )- ^ ia ( H )^ 21 ( B ) 


为 AR 矩阵多项式的行列式，将模型左乘 
元模型改写为 


^22(^) 
-中 21(5) 


—:::s] •可以将这个二 



^22(0)011(^)- ^12(5)0 21 (0) ^22(^)0 12 (5)- ^i 2 (S)e 22 (B) 1 T a lt 

中 u(B)e 21 (S)-+ 21 (B)e u (B) ^n{D)e 22 {B)-^ 2 l (B)e l 2 {B) \ [ a 2t 


考虑 r lt 的方程. （8.30) 式的第一个条件表示 r lt 并不依赖于吻或 r 2t 的任何过 
去值.对 r 2t 的方程， (8.30) 式的第二个条件隐含了〜确实依赖于 a lt 的某些过去 
值.根据 （8.30) 式，0!2(丑)= ^ 12 ( B ) = 0 是从到 r 2t 存在单向关系的充分但不 
必要条件. 

VARMA 模型的估计可以通过条件最大似然或精确最大似然方法来实现.对 
拟合模型的残差序列. Q k { w .) 估计量仍然适用，但是它的渐近 x 2 分布的自由度为 
k 2 m - //，其中#是 MA 和 AR 系数矩阵中待估参数的个数. 

例 8.6 为了说明 VARMA 的建模，我们考虑美国的两个月利率序列.第一个序列 
是期限为1年的国库券利率;第二个序列是期限为3年的国库券利率.数据宋自于 
圣 • 路易斯联邦储备银行，样本区间是从1953年4月至2001年1月，共574个观 
测值.为了确保美国利率为正，我们分析对数序列.图表明了两个对数利率序 
列的时间图.实线表示1年期利率.这两个序列在样本期间内的运动非常接近. 

M ( t ) 统计量和 AIC 准则对数据指定了一个 VAR (4) 模型.然而，我们采用了 
一个 VARMA (2,1) 模型，因为这两个模型提供了类似的拟合.表8~7给出了由精确 
似然方法得到的 VARMA (2，1) 模型的参数估计.我们去掉了不显著的参数并且重 
新估计了简化的模型.所拟合模型的残差序列具有轻微的序列相关且在延迟7和 
延迟处有交叉相关性.图8~9给出了残差图，从图中可见存在一些异常数据点. 
模型可以进一步改善，但是它看上去已经很好地刻画了数据的动态结构. 
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图8> 8 从1953年4月到2001年1月美国月利率对数的时 间图. 实线为1年期的国库券的 
月利率的对数，虚线则对应3年期 


表8^7基于精确似然方法对美国的两个月利率序列拟合 VARMA (2,1) 模型时的参数估计 


Parameter 







Estimate 

1.82 

-0.97 

0.09 



圓 





Staudard error 

0.03 

0.08 

0.01 




m 


H 

■ 


( a ) 1 年期利率的残差 



( t >) 3年期利率的残差 



' »-1-1- 1— 

I960 1070 1080 1000 2000 


年 

图8>9例 8.6 中美国的两个月利率对数的残 差图. 所拟合模型为 VARMA (2,1) 模型 


最后的 VARMA (2, 1) 模型表明数据具有一些有趣的特征.第一，利率序列是 
高度同步相 关的. 同步相关系数为 2.5 />/3.58 x 2.19 = 0.893. 第二，从3年期利率 
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到1年期利率存在单向线性关系，因为所有 AR 和 MA 矩阵的第 (2,1) 个元素都 
为【).佰某些第 (1,2) 个元素不是 0. 事实 h ， 表 g _7 中的模型 说明： 


v^t =0.025 + 0.99r3,t-i + (i3t + 0.47^3, 卜 1 ， 

Tit =0.028 + 1.82rt i e- i — 0.84ri,e_2 — 0.97r3 f t—i + 0-98r3 f t-2 
+an — 0.90 ai f ^_i + 1.66 a 3 ,t 一 i . 


其中 ~ 为；年期利字的对数序列，为相应的扰动序列.因此，3年期利韦并不 
依赖于1年期利率的过去值，但是1年期利率依赖于3年期利率的过去值.第三， 
这两个利率序列看上去似乎是单位根非平稳的，利用向后推移算子汉模型可以近 
似改写为 


(1 - B ) r 3t = 0.03 + (1 + QAlB ) a iu 

(1 — 5)(1 — O.B2B)rit = 0.03 — 0.975(1 — B)r^t 十 （1 一 0.9£?)<iit 4* 1.665a3t. 


分量的边际模型 


给定 r t 的一个向量模型,隐含的组成部分的一元模型就是边际模型 ( mar ¬ 
ginal models ). 对一个 /c 元 ARM A ( p , q ) 模型,边际模型是 ARMA [ kp , (k - l)p + g ]. 
这个结果可以通过两步得到.第一步， VMA ( g ) 的边际模型是一元 MA [ q ). 假定 r , 
是一个 VMA ( g ) 过程.因为 n 的交叉相关-矩阵在延迟步截尾（即对 l>q ，有 
仍= 0)， r it 的 ACF 在超出延迟 <7后是 0. 因此, r it 是一个 MA 过程，并且它的一 
元模型具有形式 r „ - 化, 0 + f 这里 { b it } 是不相关的随机变量序列，均 

值为0,方差为岵.参数氏/和心是的 VMA 模型参数的函数. 

第二步要得到的结果是对角化 VARMA ( p , g ) 模型的 AR 矩阵多项式.为了更 
好地说明，考虑二元 AR (1) 模型 



一龟 12( 召） 

ru 


ait 

— 少 21( 五） 

1 — 伞 22( 丑） 

_ r 2 t 


o^2t 


左乘多项式 


二)二1，得到 


1(1 — 中 "5)(1 — 中 22®)— 中 12办22万 2 1 


ru — 1 — 中 23( 只) 

r 2t 


^ vj ( n ) 


«3< 


前面方程的左边表明 n , 的一元 AR 多项式是 2 阶的.而方程的右面具有 VMA ( l ) 
的形式.利用第一步中 VMA 模型的结果,我们证明了 r „ 的一元模型是 ARMA (2，1) 
的.这个方法很容易推广到 fc 元 VAR ( l ) 模型,其边际模型为 ARMA ( A:，Jk - 1). 更 
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—般地，对一个 A •元 VAR(p) 模型，其边际模型为 ARMA[ibp, (fc-l)pj. VARMA 模 
型的结果可直接从 VMA ^ VAH 模型的结果中得到. 

阶 [fcp,(fc-l)p + g ] 是边际模型的最大阶（即上界). ri< 的真实边际阶可能会更 
低. 


8.5 单位根非平稳性与协整 


当对儿个单位根非平稳时间序列联合建模时,可能遇到 协整的 情况.考虑二元 
ARMA(1,1) 模型 


Xlt 


0.5 

-1.0 ' 


工 M-l 


ait 


0.2 

-0.4 



^2t 


-0.25 

0.5 




0-2t 


-U.l 

0.2 




(8.31) 


其中扰动叫的协方差矩阵 S 是正 定的. 这并不是一个弱平稳模型，因为 AR 系数 
矩阵的两个特征值分别为 0 和 1 •图 8-10 给出了 E = / 时的 200 个模拟数据点的 
时 间图； 而图8^11给出了两个分量的样本自相关系数.很容易看出，这两个序 
列具有高度自相关而且表现出单位根非平稳的特征 . A 的两个边际模型的确是单 
位根非平稳的.将模型改写为 


'1 - 0.5B B 


Xu 


' 1 - 0.2B OAB ' 


ait 

0.25B 1 一 


. X2t 


0.1B 1 - 0.2J5 


a2t 



图 8-10 当扰动的协方差矩阵为单位阵时， (8-31) 式所定义模型的模拟序列的时间图 
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序列： 






III I4I H I4+ 

0 5 10 15 20 

间隔 

序列 ：h 





lllllllllii 


0 5 10 

间隔 


0.8 



0.8 



图 S-U 当扰动的协方差矩阵为单位阵时， (8.29) 式所定义模型的两个模拟分量序列的样本自 
相关函数图.观测值为200个 


将上述方程乘以 


1 - 0.5J3 -B 
-0.25B 1 - 0.5B 


得到 





.1 - 0,7B 

-0.6B 


ait 


X2t 


-0.15 丑 

1 - 0.7B 


«2£ 


因此.模型的每个分量都是单位根非平稳的，且服从一个 ARIMA (0,1,1) 模型. 
然而，我们可以考虑如下一个线性变换.定义 


yu 

V2t 

= 

1.0 -2.0 

0.5 1.0 


xu 

x 2t 

s Lx tl 

b lt ' 

f>2t 

= 

•1.0 -2.0 
0.5 1.0 


an 

a 2 t 

三 La t . 


变换序列的 VARMA 模型可以得到 


Lxt = L^xt-i + La t - £»0a t _i 

= L^L * Lxt—\ La，i — L&L * L>ctt—i 

= L^L l (Lx t -i)^b f -L&L l b t -i. 

这样，的模型为 


yu 


1.0 0 


I/M-l 


bu 


0.4 0 



V2t 


0 0 


. V2,t-l , 


f>2t 


0 0 


b2,t-i 


(8.32) 
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由此模型看出： （ a ) 与 y 2 , 是分离序列，其同步相关系数等子扰动 fc lt 与&之 
间的同步相关系数： （ b ) 如服从一个一元 ARIMA (0,1,1) 模型； （ c ) j / 2l 是一个白噪 
声序列（即伽= <> 2< ).特别地， (8.32) 式的模型表明系统中只有一个单位根.因此 
: ru 与心的申位根是由的单位根引 入的. 在相关文献中，称 y lt 为叫与项 
的共同趋势. 

XU 与0：2*都是单位根非平稳的但在向量序列中只存在一个单位根，这种现象 
在计量经济和时间序列文献中称为协整 （ co~integratioii). 另一个定义协整的方式则 
着眼于单位根非平稳序列的线性变换.在对模型 (8.31) 进行模拟的例子中，变换表 
明线性组合他= 0.5 a; lt + ar 2< 没有单位根.因此，称; r lt 与办是协整的，如果 （ a ) 
它们两个都不是单位根平 稳的； （ b) 它们的一个线性组合是单位根平稳的. 

一般而言，对一个々元单位根非平稳时间序列，如果系统中的单位根个数小于 
fc ， 则协整 存在. 令 h 表示 k 元序列中单位根的个数.如果0 < /» < fc ， 则存 
在协整.而且， fc - / I 为协整因子的数目.换言之，协整因子的个数为具有单位根 
平稳性的不同线性组合的个数，这种线性组合称为协整向量.对前面模拟的例子, 
V 2 t = (0.5, l ) a ： t , 因而 （0.5,1)' 是系统的一个协整 向量. 更多关于协整和协整检验的 
讨论，可参见 Box 和 Tiao (1977), Engle 和 Granger (1987), Stock 和 Watson (1988) 
以及 Johansen (1988). 我们将在 8.6 节讨论协整 VAR 模型 

协整的概念很 有趣. 并且在文献中已经引起了人们的大量关注.然而，实际应 
用中对协整的检验有些困难.困难的主要原因是协整检验忽视了分量序列的尺度效 
应.感兴趣的读者可以参考 Cochrane (1988); Tian, Tsay 和 Wang (1993). 这些文 
献中有进一步的讨论. 

尽管我对协整检验的实际价值感到怀疑，然而协整的思想与金融研究是高度相 
关的.例如，考虑 Finnish Nokia 公司的股票.它在 Helsinki 股市上的价格必领与 
纽约证券交易所中它的美国信托收据 （American Depositary Receipts ) 的价格联动， 
否则对投资者而言就#在套利 机会. 如果股价有单位根，则两个价格序列一定是协 
整的.实际中，在调整交易成本和汇率风险 之后. 就存在这样的协整.稍后在 8.7 节 
中我们将讨论此问题. 

误差-修正形式 

因为在协整系统中.单位根非平稳分量的个数多于单位根的个数，所以对于单 
个分量差分所得到的平稳性结果是差分过度的.过度差分导致了 MA 矩阵多项式 
中的单位根问题.这反过来可能在参数估计中会遇到困难.如果 MA 矩阵多项式包 
含单位根，则称向量时间序列是不可逆的. 

Engle 和 Granger (1987) 讨论了一个协整系统的误差修正表示.它克服了不可 
逆的 VARMA 模型估计中的困难.考虑 (8.31) 式的协整系统.令△: r t = , 

是差分后的序列•将 x t _, 代入方程的两边.我们得到对的一个模型， 
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Aa ： i t 


-0.5 

-1.0 



4- 

flu 


0.2 



-0.25 

-0.5 



i 

d 2 t 


-0.1 

_ 

-1 

[0.5,1.0] 


+ 



0.2 


一 0.5 

1 


工 2, t-l 


0>2 t 


-0,1 


-0.4 


OU-l 

0.2 



-0.4 ' 



0.2 


0>2, t - 


这是一个平稳模型，因为 △叫与 [0.5,1.0] = y 2 t 都是单位根平稳的.因为上述 

方程的右端用到了 所以 MA 矩阵多项式同未差分前一样，从而模型不会遇 

到不可逆 问题. 此公式称为的误差修正模型 （ error ^ correction model ). 它可 
以扩展到一般的协整 VARMA 模型.对一个具有 m 个协整因子 （m < A :) 的协整 
VARMA ( p , g ) 模型，其误差修正表示为 


p— 1 4 

Aac f = a^xt-i + + Qt ~ (8.33) 

*=i j=i 

这里 《 和卢都是 A : x m 满秩矩阵 . AR 系数矩阵*:是原始系数矩阵电 j 的函数, 
具体地，我们有 B 

p 

办 • ， i =1,-> • ,p- 1, 

4= i+i 


a(3' = 十中 p-i +... 十爭 ！ - J= — 伞 （ 1). (8.34) 

该结果是令 AR 矩阵多项式的系数矩阵相等得到的.时间序列 f 3 r x . t 是单位根平稳 
的，并且/3的行向量为： c t 的协整向量 

在误差修正表示 (8.33) 中出现平稳序列是很自然的，可以将它认为是 
过度差分系统中的-个“弥补”项. 平稳性的证明 如下： 单位根时间序 

列理论证明了单位根非平稳序列与平稳序列之间的样本相关系数在样本量趋于无 
穷时收敛到 0. 参见 Tsay 和 Tiao(1990) 及其参考文献.在个 误差修 正表示中, 
是单位根非平稳的，但是是平稳的.因此，将与而^有意义地联系 
起来的唯一方式是通过平稳序列 

注释： 我们对协整的讨论假定所有的单位根重数为1，但是这个概念可以扩 
展为单位根为多重的情形.如果协整因子的个数 m 给定，则 （ 8.33) 式的误差修正 
模型仍然可以通过似然方法来估计.下一节我们将讨论协整 VAR 模型的简单例子. 
最后，有许多方式可以用来构造误差修正表示.事实上 ，在 (8.33) 式中，只要对 AR 
系數矩阵 f 进行某些修正，则对任 何的” 满足1彡 V 彡 p ， 都可以用 ap ' xt - r . □ 


8.6 协整 VAR 模型 

为了个更好地理解协整，我们集中讨论 VAR 模型，这主要是因为它们很容易估 
计.考虑可能带有趋势项的 A ： 元 VAR ( p ) 时间 序列; 
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*t = ^ + *#-i + . •. + ^pXt-p + at, (8.35) 

其中新息叫为高斯的，并且 /i t =Mo + Mit 这里和 A 都是维常数向量.记 
^( B ) = JU - ^ P BP . 如果 |^(B)| 的所有根都在单位圆外，则是单位 
根平稳的.在相关文献中，称一个单位根平稳过程为 7(0) 过程.即该过程是不可加 
的.若|中(1)| = 0,则称 x t 为单位根非平稳的.为简单起见，我们假定&至多是一 
阶可加过程，即/⑴过程.这意味着， 如果〜 不是单位根平稳的，则 
单位根平稳的. 

VAR(p) 过程: 的误差修 TF. 模型 (ECM) 具有如下 形式： 

= Mt + + .. * + +a t , (8.36) 

其中 f 由 (8.34) 式定义 , 且 II = a〆= 伞 (1). 我们称 (8.36) 式的 n® ( _i 为误 
差修正项，该项在协整研究中起着非常重要的作用.注意到中，可以由 ECM 表示 
通过下式恢复 出来： 

t = j+n+ 中 I ， 

- * = 2, - - ,p 

其中办;；为零矩阵 基于: n t 至多是 7(1) 过程的假定.有 (8.36) 式的 A:r t 是 7(0) 
过程. 

如果而包含单位根 t 则 陴 (1)| = 0,从而 n = #(1)是奇 异的. 所以在考虑 

(8.36) 式的 ECM 时，有下面三种情况. 

(1) Rauk(n) = 0,这意味着 II = 0 且; c t 不是协整的. （8.36) 式的 ECM 退化 
为 

Ax t = Mt + + . • • + 伞 G_ 1 Ai t _ p+1 + a t , 

因此 △: c , 服从带确定性趋势的 VAR(p-l) 模型. 

(2) Rank(n) = k . 这意味着|办 (1)| / 0, 从而々不包含单位根，即々是 1(0) 
过程.此时 ECM 模型是无效的，直接研究 x, 即可. 

(3) 0< iUuk(n) = m < k . 在这种情形下，可以将 n 写为 n =⑽，其中 a 
和 /9都是 k x m . 矩阵且 Rarik(at) = Rauk(/3) = m. (8.36) 式的 ECM 变为 

n = a/^, (8.37) 

这意味着: t t 是协整的，有 m 个线性独立的协整向量叫=秌〜，有 k_m 个单位 
根，这些单位根给出了： r t 的 fc-m 个公共随机趋势. 

如果 A 是协整的并且 Rank(n) = m, 则得到这 k-m 个公共趋势的一个简单 
办法是先计算《的正交补矩阵 a 丄，即 a_L 是 it x (fc-m) 矩阵并且满足 a', a-O. 
这里的0是 A: x (fc -m) 阶零 矩阵； 然后 令！/,= a', a . 实际上，在 ECM 两端左乘 
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并利用 n = 所得到的方程不再含有误差修正项.因此 fc - m 维向量的 

应该有 A : - m 个单位根.为进一步说明，考虑 8.5.1 节的二元例子.对于该特殊情 
形，《 = (-1，-0.5)'， cr ± = ( 1 ，_2)，.因此队=( 1 ， ~ 2 ) x t = x n - 2 x 2 t , 这正是 (8.32) 
式的单位根非平稳序列 y lt . 

注意到 （8.37) 式的因子分解是不唯一的，因为对于任何 m x m 阶 FH 交矩阵 n 
满足 nn' = /，我们有 

= afin(3' = (an){f3QY = «•〆 •， 

其中 《 •和 f 的秩都是 m. 若要唯一确定《和/3,则需要额外的限制条件.通常 
要求〆 =其中是 m xm 单位阵 • A 是 (k - m) x m 矩阵.实际中，这 
可能要 求将* t 的分量进行重排，使得前 m 个分量都有单位根.为了使 a = ^xt 
是单位根甲稳的， a 和0的分量必须满足其他的限制.例如，考虑有一个协整向量 
的二元 VAR(l) 模型. 这里， fr = 2, m = 1, ECM 是 

= Mt + [i, + a t . 

^ 012 

在上式中左边同乘以才，利用叫_< = /3 f x t - iy 并且将叫_丨移到方程的右边，我们 
可以得到 

vtt — + (1 +ai 4- a 2 Pi)w t -i -f 

其中 = (3' at. 这意味着叫是平稳 AR(1) 过稈. 闵此，和洗必须满足平稳性 
限制 |1 -f- tti + ocifli I < 1. 

前面的讨论表明，在 (8.36) 式的 ECM 中 . II 的秩是协整向量的个数.因此要检 
验协整，只需要检査 II 的秩. 这正是 Johanscn(1988, 1995) 和 Reinsel 和 Ahn(1992) 
所采用的方法. 

8.6.1 确定性函数的具体化 

类似于一元的情形，协整检验的极限分布依赖于确定性函数 /A ,. 本小节将讨 
论文献中已 有的叫 的具体指定问题.为了理解下面的一些陈述，记住对于 
协整序列: r t 的共同随机趋势给出了一种表示. 

(1) /^ = 0 ： 此时： ^的所有分量序列都是不带漂移项的/(I)过程，平稳序列 

的均值为 0. 

(2) Mi ” Po — ac o^ 其中 Co 是 m 维非零常数向量. ECM 变为 

= ct{0 r xt-i + Co) + +... + + a t , 

因此〜 的所有分量序列都是不带漂移项的 /(I) 过程，但是⑼有#零均值- C0. 
这是限制为常数的情形. 
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(3) 0. 这时，而的所有分量序列都是带漂移项 Mn 的/⑴过程且 

叫有非零均值. 

⑷ H t = Ho + 其中 Cl 是非零向暈. ECM 变为 

= /x 0 +ctO + ^IAi t _i + --- + ^*_ 1 Aa; 1 _p +1 +a,, 

(8.38) 

囚此的所有分量序列都是带漂移项 / x c 的 /( l ) 过程且心有与 C| / 相联系的线 
性时间趋势.这是带限制性趋势的情形. 

(5) ^ = /1 0 + ^<,其中叫是非零的.这里常数和趋势都是没有限制的 . 力的 
分量都是带二次时间趋势的 "1) 过程，叫具有线性趋势. 

显然,最后一种情形在实证工作中不是很常见.对于经济序列而言第一种情况也不 
常见，但是可以代表某些资产的对数价格序列.第三种情况在给资产价格建模时也 
很有用. 

8.6.2 最大似 然估计 

本小节将简要列出协整 VAR ( p ) 模型的最大似然估计方法.假设数据为 {x t \t^= 
1，•…，: n . 小失一■般性，记〜= Mdf , 其中忒= [ U }\ 这可以理解为〜依赖于前 
一小节的具体 指定. 对于给定 II 的秩 m ， ECM 模型变为 

△set - nd t + 4- y △: r t _i + | - hot , (8.39) 

其中< =p + i ，.. •，: T . 估计中关键的一步集中在与确定性项和平稳效应相联系的 
似然函数上.这可以通过考虑下面的两个多元线性回归得到 

Ax t = 7 orfi + n ! A * i _ i + u t , (8.40) 

x t -\ =7 i<it + SiA*,_i 4 - • • • 4- Sp _ iA x <_, h-i + v t . (8.41) 

令仏和 h 分别表示 (8.40) 式和 (8.41) 式的 残差. 定义下述样本协方差矩阵 

S °° = = H = jr^v ^ 

*= P +1 ^ ^= p-ht P 

接下来，计算 S 10 S ^ l Sox 关于 S „ 的特征值和特征向量.这等价于求解下述特征 
值 问题： 

|ASn SioS^} 5oi| = 0. 

将特征值和对应的特征向量记为 ( A ,, e ,). 其中 A , > A 2 > .. A fc . 这里特征向量己 
经标准化了，即 e ' S u e = /，其中 e = [ ei , •• - , e fc ] 是特征向量 矩阵. 
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协整向量;9的未标准化的最大似然估计 ( MLE ) 是冷= , e m ], 由此可以得到 
/3的满足识别性限制和标准化条件的 MLE . 将得到的估计记为九，其中下标 c 表 
示满足一定限制.其他参数的 MLE 可以由下述多元线性回归 得到： 

△A 二 十 tx^ c x t -\ + 十 ..• + 番 ; wAxt—p+i 十 ctt. 

基于 m 个协整向量的似然函数的最大值为 

^ mi!x a l^ooI fj(l - Aj ). 

«=1 

在检验 Rank ( n ) = m 的似然比检验中会用到该最大值.最后 a 和的正交补可 
以由下式 得到： 

厶丄= Sqq 5 ii [ e „,+ i , … ， e * j , 冷丄= sii [ e m + i , … , e *]. 

8.6.3 协整检验 

对于具体的确定性项…我们来讨论检验 （8.36) 式中矩阵 n 的秩的最大似然 
检验•令 H ( m ) 为零 假设： Rank ( n ) = m ，例如，在 H ⑼下， Raiik ( n ) = 0,从而 
n = 0 , 即没有协整.这些零假设具有如下关系 

孖⑼ C . •. C H(m) C •.. C H(k). 

为进行检验， (8.39) 式变为 

△ac ， 一 十 Uxf^i -j* 十" •十 Asc^-p^i + a< ? 

其中 f = p + i ，• • • ，7\我们的目标是检验 n 的秩.从数学上来讲 . n 的秩是 n 的 
非零特征值的数目，从而如果能得到 n 的相合估计，则可以估计 n 的秩.基于前 
面的方程（该方程是多元线性回归的形式)，我们看到 n 是调整本和= 
1,…， p -1) 带来的效应后〜,和的协方差矩阵.必要的调整可以由上一小 
节处理多元线性回归的技巧 得到. 事实上，调整后的和分别为心和 
于是进行协整检验的方程变为 

tit = Ilv^ + at. 

在正态性假设下，可以用 h 和心 的典型相关分析进行上式中 n 的秩的似然比 
检验. 关于典型相关分析参见 Johnson 和 Wichern (1998). 因为已经调整了 和 

A* f _ i (i = l ,..., p ) 带来的效应，所以与典型相关分析相联系的是和 
偏典型相关分析.量{^}是^和 h 的典型相关系数的平方. 

考虑假设 

H 0 : Flank ( II ) = m 对 H a : Rank ( EI ) > m . 
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Johanseu (1988) 提出下述似然比检验统计量来进行 检验： 

k 

LK tr {m) = 一 (T - p ) ln(l - A <) (8.42) 

i=m+l 

若 IUnk ( n ) = m ，则 a i > m 时 X , 应该很小，因此 LK tr ( m ) 也应该很小.该检验 
称为迹协整检验.由于单位根的存在， LK tr ( m ) 的渐近分布不再是 x 2 分布，而是标 
准布朗运动的函数.因此 LK ^ m ) 的临界值必须通过模拟得到. 

Johansen (1988) 还考虑了一列程序来确定协整向量的个数.特别地.考虑下述 
假设： 

H 0 - Rank ( n ) = m 对 H a : Rank ( IT ) = m + 1. 

LK 检验统计置.也称为最大特征值统计量，为 

L /( m ax ( m ) = —(T — p) ln(l - 

问样.统计量的临界值是非标准的，必须通过模拟来得到. 

8.6.4 协整 VAR 模型的预测 

所拟合的 ECM 模型可以用来进行预测.第一，基于被估参数， ECM 方程 oj 以 
用来得到差分序列的 预测. 这样的预测可以反过来得到心的预测. ECM 预 
测和传统的 VAR 预测的区别在于用 ECM 方法进行预测时加上了协整关系. 

8.6.5 例子 

为了进•步说明 VAR 模型的协整分析，考虑两个美国短期周利率.序列分别为 
I 958 年 I 2 月 I 2 日到 2 0 CM 年8月6日的3个月期和6个月期的国库券利率.数 
据来自于二级市场，是从圣路易斯联邦储备银行得到的.图8~12给出/利率序列 
的时间序 列图. 如所料想,这两个序列的运动非常靠近. 

我们的分析是在 S - Plus 中进行的，进行 VAR 分析时利用命令 VAR ， 进行协整 
检验时利用命令 coint , 进行向量误差修正估计时利用命令 VECM . 分别用 tb 3 m 和 
tb 6 m 表示两个序列，并定义向量序列 a = ( tb 3 m , tb 6 m ) / . 扩展的 Dickey - Puller 单 
位根检验不能拒绝每个个体序列有单位根的假设.参见第2章.实际上，当给3个 
月期和6个月期的利率序列拟合 AR (3) 模型时，检验统计量分别为 -2.34 和-2.33, 
V 值大约为 0.16. 这样，我们继续进行 VAR 建模. 

对于二元序列 a ；,， BIC 准则选择了 VAR (3) 模型. 

> x = cbind ( tb 3 m • tb 6 m ) 

> y = data . frame ( x ) 

> ord . choice $ ar.order 
tl ] 3 
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(«) 



I960 1970 1980 1990 2000 

年 

图 8-12 两个美国短期周利率的时间序列图.样本的时间区间是从1958年12月12日到 

2004年8月6曰 •（ a ) 3个月期国库券 利率； （ b ) 6个月期国库券利率.数据来自 
二级市场 


为了进行协整检验，我们选择常数限制的因为事先没有理由相信美国利率存在 
漂移. Johansen 的两个检验都证实了拟合 VAR,(3) 模型时，这两个序列是有一个协 
整向量的协整序列. 

> cointst.rc^coint(x # trend- # re # # lagG_2) % lags » p-l. 

> colntot.re 
Call: 

coint{Y = x, lags = 2, trend = "re") 


Trend Specification : 

HI*(r) : Restricted constant 


Trace tests sign, at the 5% 
Trace tests sign, at the 1% 
Max Eig. tests sign, at the 
Max Eig. tests sign, at the 


丄 eve 丄 are flagged by # • 

level are flagged by 
5% level are flagged by # • 

1% level are flagged by # . 


Tests for Cointegration Rank : 

Eigenvalue Trace Stat 95% CV 99% CV 
H(0)++** 0.0322 83.2712 19.96 24.60 


H(l) 


0.0023 5.4936 


9.24 12.97 


Max Stat 95% CV 99% CV 
H(0)++** 77.7776 15.67 20.20 

H(l) 5.4936 9.24 12.97 


接下来，用 ECM 表示对该协整 VAR (3) 模型进行最大似然佔计.结采 如下: 





> vecm.fit=VECM(cointst.rc) 

> summary(vecm.fit) 

Call ： 

VECM(test = cointst.rc) 

Cointegrating Vectors : 

coint.1 

1.0000 

tb6m -1.0124 

(std.err) 0.0086 

(t.stat) -118.2799 

Intercept* 0.2254 

(std.err) 0.0545 

(t.stat) 4.1382 

VECM Coefficients ： 

tb3ni tb6m 
coint.1 -0.0949 -0.0211 
(std.ecr) 0.0199 o.0179 
(t .atafj -4.7590 -1.1775 

tb3m.lagl 0.0466 -0.0419 
(std.err) 0.0480 0.0432 


(t.stat) 0.9696 -0.9699 

tb6m.lagl 0.2650 0.3164 

(std.err) 0.0538 0.0484 

(t.stat) 4.9263 6.5385 

tb3m.lag2 -0.2067 -0.0346 
(std.err) 0.0481 0.0433 

(t.stat) -4.2984 -0.8005 

tb6m.lag2 0.2547 0.0994 

(std.err) 0.0543 0.0488 

(t.stat) 4.6936 2.0356 



tb3m tb6m 
R-squared 0.1081 0.0913 
Adj. R-squared 0.1066 0.0898 
Resid. Scale 0.2009 0.1807 

> plot(vecm.fit) 

Make a plot selection (or 0 to exit) 


1: plot ： All 
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2: plot ： Response and Fitted Values 
3 : plot ： Residuals 


13: plot : PACF of Squared Cointegrating Residuals 
Selection ： 


如所料想.输出结果表明平稳序列为 » tb3m t - tb6m t , 的均值大约为 
-0.225. 拟合的 ECM 模型为 


-0.09 


- 0.02 


(t/;，- 1 + 0.23) + 


0 05 0 27 i 

-0.04 0.32 


-0.21 0.25 A 

Axt-Q -4-a,, 

-0.03 0.10 


估计的 a, t 的标准误差分别为 0.20 和 0.18. 可以通过不同的图来检査所拟合模型 
的允分性.为了进一步说明，图 8-13 给出了协整残差图.在图中有一些大的残差, 
这发生在1980年早期，利率很高并且波动剧烈. 



图 8-13 为美闽短期周利牟拟合的 ECM 的协整残差图 . 样本的时阗区 N 是从 
1958 年 12 月 12 日到 2004 年 8 月 6 日 

最后.我们用拟合的 ECM 模型来产生 AO：, 和 * ，的向前1步预测和向前10 
步预测.预测原点是2004年8月6曰.图 8-14 和图 8-15 分别给出了差分序列和 
原始序列的预测图.这两个阁中都包含一些观测数据点.图中的虚线是置信水平为 
95%区间预测由于单位根非平稳性的存在，该区间很宽且没有实际意义. 

> vecm.fst=predictIvecra.fit # n.predict«10) 

> summary(vecra.fst) 
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Predicted Values with Standard Errors ； 


tb3m tb€m 


1- step-ahead -0.0378 

(std.err) 0.2009 

2- step-ahead -0.0870 

(std.err) 0.3222 


-0.0642 


0.1807 

-0.0864 

0.2927 


10-step-ahead -0.2276 -0.1314 
(otd.err) 0.8460 0.B157 

> plot(vecm.fst,xold=diff(x),n.old=12} 


> vecm.fit.level=VBCM(cointst.rc,levels=T) 

> vecm.fst.level-predict(vecm.fit.level, n.predict= 10 ) 

> summary(veem.fst.level) 


Predicted Values with Standard Errors : 
tb3m tb6m 

1- step-ahead 1.4501 1.7057 

(std.err) 0.20(39 0.1807 

2- step-ahead 1.4420 1.7017 

(Std.err) 0.3222 0.2927 

10-step-ahead 1.4722 1.7078 
(std.err) 0.6460 0.8157 
> plot(vecro.fBt.level, xold=x, n.old=50) 


2375 2380 2385 2 細 


0*5 - 

/ 

/ 

0.5 - 

/ 

0.0- 

\ "*. 

0.0- 


-0.5 - 

\ 

\ 

—0,5 - 

..... 

\…… 

\ 

••••••• 

••• 

-1.0- 

\ 

指数 

\ 


2375 238() 2385 2300 

• ill 


围 8-14 利用为美国短期周利率拟合的 ECM 进行预测的预测图 . 预测是关十差分序列的， 
且预测原点是 2004 年 8 月 6 口 
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2340 2350 2360 2370 2380 2390 




图 8-15 利用为美国短期周利率拟合的 ECM 进行预测的预测图.预测是关于利率序列的. 
且预测原点是2004年8月6日 


8.7 门限协整与套利 


本节主要讨论在指数夂易中利用多元时间序列方法探测套利机会.同时，我们 
指出，与协整思想相结合，第4章中简单的一元非线性模型町以自然地推广到多兀 
情形. 

我们的研究考虑 S&P500 指数期货的价格与现金市场上以该指数为标的的股 
份价格之间的关系.令 / U 表示到期时间为 f 的指数期货在时刻 （ 的对数价格，且 
令表示现金市场上的以指数为标的的股份在 < 时刻的对数价格.在金融文献中, 
实现成本模型 （cost-of-carry model) 的一个版本认为 


ft,i - = { rt,i - qt , i){l - 0 + 2 ty (8.43) 

这里 r M 是无风险利率，是关子 t 时刻现金价格的红利收益 ， （Z f ) 是期货合约 
的到期时间.具体可参见 Brenner 和 Kroner (1995), Dwyer , Locke 和 Yv » (1996) 及 
其参考文献. 

模型 (8.43) 中的过程 < 必须是单位根平稳的，否则就存在持续的套利机会. 
这里的套利交易包括，当期货合约在到期日以前的对数价格偏离到大于随时间持有 
指数的成本时，同时购买（卖空）证券指数，并卖出（购买）指数期货.在彳的弱平 
稳假定下，为了有利可图，岑的模一定超过一个由交易成本和其他的经济因素和风 
险因素决定的一个特定值. 
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通常认为 S & P 500 指数的 / u 与〜序列都包含一个单位根.但是 (8.43) 式表 
明它们在调整利率和红利收益的影响之后是协整的.调整后的协整向量为（1，一 1)， 
协整序列是因此，应该利用误差修正形式來对收益率序列 n 建 

模，这里 A/ t = / t , i -/*-!,!, = 8t - s t _!, 并且为了记号的简便.我们将到期时 

间 I 从 Aft 的下标中去掉了. 

8.7.1 多元门限模型 

实际中，套利交易影响市场动态，从而.依赖于套利交易的存在与否 r , 的模型 
可能随时间变化.因此，前面的讨论自然地引出了下述模型 

P 

c ! + Ldi + + ⑴，若 $ 71. 

<=1 

U + + 若 71 < Zt^x < 721 (8.44) 

»=1 
P 

C 3 + E^V t-i + ^3 z t—l + 若 72 < 為 -1. • 

•=>l 

其中 A = 1002 ( *, 71 < 0 < 72 是两个实数， { a ； 0 } 是彼此独立的二兀白噪声序列.这 
里我们用 2 t = 1002；,因为 2< * 的实际值相对较小. 

(8.44) 式中的模型称为三体制的多元门限模型.两个实数 71 和 72 是门限， 
2 t - i 是门限变童.门限变量 zt - i 是由数据支持的（参见 Tsay (1998)). —般考虑 
d € {1，…， do }， 可以选择作为一个门限变量，其中 rf 0 是一个预先指定的正整 
数. 

模型 （8.44) 是第 4 章中门限自回归模型的推广.它也是 （8.33) 式中误差修正 
模型的推广.如前所提到的，只有当 <( 或等价地， 2 t ) 的模相当大时，套利交易才 
是有利可 图的. 因此模型 (8.44) 只有在体制1和体制3会有套利交易发生.这样 
体制 2 中的 / u 与知间的动态关系主要是由正常市场力量决定的，从而两个序列 
或多或少类似于一个随机游走.换句话说，中间体制的两个对数价格应该不受套利 
的 影响. 从而也不受协整的 限制. 从经济计量的观点看,这意味着中间体制的估 
计应该是不显著的. 

总之，我们期望期货的对数价格与现金市场上的证券指数的对数价格之间的协 
整效应在休制 1 与体制 3 中都是显著的，但是在体制 2 中不显著.这种现象称为门 
限协整.可参见 Balke 和 Fomby (1997). 

8.7.2 数据 

在下面的实例研究中使用的数据是 S & P 500 指数在1993年 .5 月的円内交易 
数据与它在芝加哥商品交易所的 6 月份期货合约.具体可参见 Forbes , Kalb 和 
Kofman (1999). 他们利用这个数据构造了一个具有7 060个观测值的每分钟的二元 
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价格序列.为了避免异常收益率的过渡影响，我们将10个异常值（每边5个）用与 
它们最近的两个值的简单平均来代替.这一步并不影响分析的定性结论，但是可能 
影响数据的条件异方差性.为了简便，我们在研究中不考虑条件异方差性.图 8-16 
是指数期货和现金价格的对数收益率的时间序列图，与模型 (8.43) 相应的门限变 
量 q = 1002；. 


( r ) 对数期货的1阶差分 



时间指数 

(b) 对数价格的1阶差分 



200U 4000 6(X)0 

时阆指数 


图 8-16 1993年5月 S & H 500 指数期货和现金价格的1分钟对数收益牟的时 fBj 图及其 

相关的门限变量 .（ a ) 指数期货的对数收益率； （ b ) 指数现金价格的对数收 益率； 

( c ) z t 序列 

8.7.3 估计 

(8.44) 式中多元 N 限模型的一个正式识别包括选择 N 限变量，决定体制个数 
以及对每个体制选择阶 P . 感兴趣的读者吋以参考 Tsay (1998); Forbes , Kalb 和 
Kofrnan (1999). 我们可以利用一些信息准则（如 Akaike 信息准则 [ AIC ] 或残差的 
平方和）来估计门限 71 和 72. 假定 p = 8, rf G {1,2, 3, 4}, 7i e [-0.15,-0.02], 
72 G [0.025,0.145], 并利用格点搜索方法（每个区间内有300个点)， AIC 选择 
作为门限变量时，门限为$ = -0.022 6, 72 = 0.037 7. 参数估计的细节见表 8*8. 

由表8~8我们观测到如下几点.第一.中间体制中么的比表明，如我们所 
料，该估计在5%水平下不显著，从而证实了当不出现套利机会时，两个对数价格之 
间没有协整.第二，对所有三个体制，都与负相关.这与第5章所讨论的 
买卖弹性是一致的.第三，指数期货的过去对数收益率看上去比现金价格的过去对 
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数收益率包含更多的信息，因为 △/,_;& 具有更显著的《比.这是合理的, 

因为一般来说，指数期货的流动性更强.关于指数套利的更多信息，可参见 Dwyer , 
Locke 与 Yu (1996)， 


表 8-8 给 1993 年 5 月的 S&P500 指数数据拟合 (8.44 ) 式中的多元门限模型时参数的 
最小二乘估计及它们的 t- 比》 
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附录 A 向量与矩阵的回顾 

附录 A 主要回顾向量与矩阵的一些代数性质.这里没有给出证明，因为相关 
证明在关于矩阵的标准教科书（如 GraybUl , 1969) 中都可以找到. 

一个 m x n 实值矩阵是一个由 m 行 n 列的实数组成的数组.例如， 

2 5 8' 

A — 

-13 4 

是一个2 x 3矩阵.该矩阵有2行3列.一般地，一个 m x n 矩阵可以写为 

ail «12 … ai,„— 1 aj n 

a 2 i a 2 2 … a 2 , n-i a 2n 

O'ml 1 ^mn 

m 整数 m 和 n 为 >1 的行數和列數， 魏 叫 称为 A 的第 ( i , j ) 个元素.尤其是，元 
素％是矩阵的对角线元素. 

一个 m x 1矩阵形成一个 m 维列向量，且一个1 x n 的矩阵是一个《维行向 
M . 文献中的向量一般指列向量.如果 m = n ， 则矩阵是一个方阵.如果对于 i 7 ^‘ 
有= 0,且 m = n , 则矩阵 A 为一个对角矩阵.如果对于 i 〆 j 有 ay = 0,而且 
对所有的 i ， 有= 1,则 A 是一个 mxm 单位矩阵，通常用 J m 表示，或当维数 
清楚时简单表示为 J . 
n x m 矩阵 

an a2i … a m i 

ai2 a22 … Om-1,2 tt m 2 

Oln a2n … ttm-l.n <hnn 

2-1 

是矩阵 A 的 转置 . 例如， 5 3 是 

8 4 

[ a ^] 来表示 A 的转置.由定义得出(^ = 且 (Ay = A . 如果 A =九则 A 是 
—个对称矩阵. 

基本运算 

假设 A = [ a <7 ] mxn , C = [^ jpx , 是两个矩阵，它们的维数在下标中给出.令& 
是一个实数.一些基本的矩阵运算定义如下. 

• 加法：如果771 = p 且 Tl = Qf ， 则 A C = (ttti ^ j ] mxn ! 


-1 3 1的转置.我们利用记号 h 
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• 减法： 如果 m = p，n =丨则 A — C7 = [a 0 •- (^ 饥如； 

• 标量乘法： 6 A = [6 a „] mx „； 

• 乘法：若 n = p ，则 AC 7 = o^^jl . 

Lu=l J mxq 

当矩阵维数满足乘法的运算条件时，两个矩阵称为可相乘的 （ conformable ). 下 
式是矩阵乘法的一个 例子： 


2 1 " 


1 2 3 ’ 


2 x 1 - 1 x 1 12 x 2 + 1 x 2 2 x 3-1 x 4 ' 

1 1 


-1 2 -4 


1 x 1- 1 x 1 1 x 2 -f 1 x 2 1 x 3-1 x 4 


16 2 
0 4 -1 J * 

矩阵运算的重要法则 包括： 

( a ) (ACY = C ' A '\ 

( b ) 一般情况下 ， AC 一 CA 

逆、迹、特征值与特征向量 

称方阵 A mxm 是非奇异的或可逆的，如果存在一个唯一的矩阵 C mxm? 满足 
AC = CA = J m , 其中， J m 是 m x m 单位阵.在这个情形. C 称为 A 的逆矩阵, 
记为 C = A X . 

A miim 的迹是它的对角线元素的和（即 tr (> l ) - f ： a u ). 很容易看出： （ a ) 

tr(A 十 C ) = tr ( A ) + tr ( C ); ( b ) tr ( A ) = tr ( A '); ( c ) 假么^个矩阵是可相乘的，则 
tr ( AC ) = tr ( CA ). 

如果= A 6, 则数 A 与 m x 1向量 6( 可能是复值）就是矩阵>1的一个 
右特征值与右特征向量对.矩阵 >4有 m 个可能的特征值.对实矩阵复特征 
值是共轭出现的.矩阵 >4是非奇异的当且仅当它的所有的特征值都不为0.用 
{ A *|* = 1, …， m } 表示特征值，则我们有 tr ( A ) = 另外，矩阵 A 的行列式 

V =1 

可以定义为 | A | = fi Ai . 对矩阵行列式的一般定义，可以参见关于矩阵的标准教材 
(如 Graybill , 1969). 

最后.矩阵 A mxn 的秩是对称矩阵 AA 1 的非零特征值的数目.对一个非奇异 
矩阵 A ， 还有 

正定矩阵 

称方阵 A(m x m ) 是一个正定矩阵，如果 （ a ) >1是对 称的； （ b ) A 的所有特征 
值都是正数.另外一种 定义： 如果对任何非零的 m 维向量 b ， 都有 6' >16 > 0,则4 
是正定矩阵. 
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正定矩阵4的有用性质包括： （ a ) 4的所有特征值都是正 实数; （ b ) 矩阵4可 
以分解为 

A = PKP 1 ， 

其中 A 是一个包含 A 的所有特征值的对角矩阵， P 是一个包括 A 的 m 个右特 
征向量的 m xm 矩阵.通常将特征值写为 Aj > A 2 ^ > A m , 相应的特征向量 
e „ - - , c m 满足 Ae , = 且 e; ei - 1. 另外，如果特征值不同的话，这些特征向 
量彼此正交(即如果 i 〆 _>，则二 0). 矩阵 P 是一个正交矩阵，这个分解称为矩 
阵/!的谱分解.例如，考虑简单的2 x 2矩阵 

s =[ 2 M , 

1 2 


它是正定的.简申的计算表明: 


2 1 " 


1 ’ 

= 3 

. 1 • 


•2 

1 • 


1 


1 ■ 

1 2 


1 

1 

» 

1 

2 


-1 


-1 


因此，3与1是 s 的特征值,标准化的特征向量分别为(大，古 y 和(为， 
很容易证明如下谱分解成立 


^ 72 

■ 2 1 • 



3 0' 

1 -1 

L y/2 3 」 

1 2 

1 -1 

L 75 75 


0 1 


对于对称矩阵4,存在一个对角线上元素为1的下三角矩阵 L 以及对角矩阵 
G , 满足>1 - LGL '. 参见 Strang (1980) 的第1章.如果 A 是正定的，则 G ? 的对 
角元素全是正的.在这种情形下，我们有 

A = LyfG \ fGL ' = LVG { LVG )\ 

其中 LVG 又是一个下三角矩阵，其平方根是逐个元素取的.这个分解称为 A 的 
Cholcsky 分解，它证明了正定矩阵 A 可以对角化，因为 


L-^A{V)- 1 = L~ 1 A(L- 1 ) / = G. 


因为 Z 是貝有单位对角元素的下三角矩阵，所以 iT 1 也是具有单位对角元素的下 
三角矩阵.再次考虑前面的2 x 2矩阵 E , 容易验证 

2.0 0.0 ' 

0.0 1,5 

满足5： = LGV . 另外. 


1.0 0.0 
0.5 1.0 


1.0 0.0 
-0.5 1.0 


且 L -^ L - 1 )* = G 
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拉直与 Kron«r;kfir 积 


将 m x n 矩阵 A 用它的列写为 A = [ ai ，… , o n ], 定义拉直算于为 vec { A ) = 
(“… ， a ； J '， 它是一个 mn x 1维向童.对两个矩阵 A mx „ 与 C pxq , A 与 C 7 
的 Kronecker 直积为 




d\\C 

(1>2\ C (122^ 
amlC7 dm2^ 


例如，假定 


A 


2 1 
-1 3 


, C 


« i , r » \C a.\ n C 

02,n-lC a2,,C 

a m , n - l ^ o. mn C 


4-13 
2 5 2 


则 vec (> l ) = (2, -1，1， 3)，， vec ( C 7) = (4, -2, -1， 5,3, 2 广且 


A®C = 


8 -2 6 4 -1 3 

-4 10 4 -2 5 2 

-4 1 -3 12 -3 9 

2 -5 -2 -6 15 6 


假设维数是合适的，则对上述两个算子，我们有下面有用的 性质: 

(1) —般地， A ® C ^ C <8> A \ 

(2) {A ® cy = A ' ® C ， ； 


(3) A ® (C 十 D ) = A ® C 7+ A ® D ; 


(4) (A ® C )( F <8> G ) = ( AF )( g » ( CG ); 

(5) 如果 A 与 C 是可逆的，则 （4 ® C )- 1 = A ' 1 ® C ~\ 

(6) 对力阵 A 和 C , tr(A ® C ) = tr ( A ) tr ( C ); 

(7) vec(A + C ) = vec (- A ) 4- vec ( C ); 


(8) \ ec ( ABC ) = ( C 1 <Si i 4) vec (_ B ); 

(9) tr ( AC ) = vec ( Cy \ ec ( A ) = vec ( A , ) / vec ( C ); 

(10) tr ( ABC ) = vec { A , ) , ( C , ® /) vec ( B ) = vec ( A ’)’( i " ® B ) vec ( C ) 

= vec ⑻ ’( A ’ ® /) vec ( C ) = vec ( B ' Y ( I <^ C ) vec ( A ) 

= vec ( C ’)’( B ’ 0 l ) vec ( A ) = vec ( C , ) / (J ® A ) vec ( B ). 

在多元统计分析中，我们经常处理对称 矩阵. 因此，可以很方便地将拉直算子 
推广为半拉直算子，它包含了主对角线或其以下的元素.具体地，对一个对称方阵 


^ = \ aij \ kxk , 定义 


vech ( A ) = ( a ; ， a ;.，... ， 
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其中 a 〗 是 >1 的第一列， Oj , ， ••- ，叫)'是 （ Ar-i + l ) 维向量. vech (^ l ) 的 
维数是 11)/2. 例如，假设 k = 3, 则我们有 VCcll (> l ) = (an , «21 , <*3 l . «22> «32 i «33) ， » 
它是一个 G 维向量. 


附录 B 多元正态分布 


一个 /C 维随机向量 : r = 0 Ti , , x k y 服从均值 M = 0^, ,^ kY , 正定协方差 

矩阵 E _ 的多元正态分布，如果它的概率分布密度函数 （ pdf ) 为 

/(a；l#i ， E) = ( 23I )fc/2|S|i/2 (8.46) 

我们利用记号 a : 〜 AT k (/ x , E ) 表示 a : 服从这样一个分布.正态分布在多元统计分 
析中起着很重要的作用，它有几个很好的性质这里仅考虑与我们的研究有关的性 
质.对具体内容感兴趣的读者可以参见 Johnson 和 Wichern (1998). 

为了深入了解多元正态分布，考虑二元情形（取 fc = 2). 在这种情形下，我们有 


S 


<Tll ffl 2 
^12 <^22 



<Tu<T22 — 0*12 


<722 —0*12 

—< Tl 2 ( T \\ 


利用相关系数 P = ^12/ (^1^2) t 这里 A = V ^" 是々的标准差，我们有 <712 = 
且 | S | = a u a 22 ( l - p 2 )， 则 * 的概率密度函数变为 


/( ii , x 2 |/ J , S ) 


2Ka\(T2\/l - P 2 


exp 


2(1- P 2 ) 


[ Q ( a ;， m , E )】 


其中伽』= (〒)％ (〒)、(〒) (〒). 

Johnson 和 Wichem(1998) 的第 4 章包含了这种概率密度函数的一些图形. 

令 c = (Cl,". ,CkY 是一个非零的 fc 维向量.将随机向量分块为 ® 

其中 aci = (sci，... , x P Y ， x 2 = (x p+ i ，•-- , XkY , 1 < p < fc. 相应地，将 /x 和 E 也分 


块得到 



Eli S12 
iJ 2 i ^22 


* 具有如下性质. 

(1) c^x - ^( cV ^ Sc ). 就是说， a : 的任何非零线性组合是一元正态的.这个 
性质反过来也成立.具体地如果对任何非零向量 c , 是一元正态的，则 * 是多 
元正态的. 

(2) Xi 的边际分布是正态的.事实上，对 Z = 1和2, ％〜 Ar fc ,( M < t Su ), 其中 


k \ = p % = k — p . 
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(3) S 12 = 0当且仅当 au 与 a : 2 独立. 

(4) 随机变量 y = (x- 服从自由度为 m 的 x 2 分布 • 

(5) X !在给定* 2 = 6下的条件分布也是正态的，即 

(aiilx^ = 6) 〜 jV p [/^ 十 _ M2)， Ell - ^12^22 ^2l]- 

最后一个性质在许多科学领域都很有用.例如，它形成了正态假定下的时间序列预 
测与递推最小二乘估计的基础. 

附录 C 一些 SCA 命令 

下面的 SCA 命令是在例 8.6 的分析中用到的. 

input xl,x2. file •m-gBln3-5301.txt ， % Load data 

rl=ln(xl) % Take log transformation 
r2=ln(x2) 

miden rl,r2. no ccm. arfits 1 to 8. 

-- % Denote the model by v21. 
mtsm v21. series rl,r2. @ 

model (i-pl*b-p2*b**2) series=c-i- (i-tl*b) noiBe. 
mestim v21. % Initial estimation 

pi(2,1)=0 % Set zero constraints 

cpl(2,1)»1 

p2 (2,1)-0 

Cp2(2 # 1)»1 

p2(2,2)=0 

cp2(2,2)-l 
tl(2,1)-0 
ctl(2,l)=l 

% Refine estimation and store residuals 
mestim v21. method exact. hold reai(resl,res2) 


miden 
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练习题 

8_1 考虑 Merck & Company, Johnson Ac Jonhson, General Electric, General Motors, Ford 
Motor Company 以及价值加权指数从 I960 年 1 月至 1999 年 12 月以百分比表示的月 
对数股票收益率，包括了红利支付.见文件 m-mrk2vw.txt. 它共有 6 列且次序同前面罗 
列的次序一致. 

( a ) 计算数据的样本均值、样本协方差矩阵以及样本相关矩阵. 

( b ) 检验零假设// 0 : =…=外= 0,其中 p , 为数据的延迟 i 的交叉相关矩阵.基于 

5%显著水平推出结论. 

( c ) 这 6 个收益率序列间有引导-延迟关系吗？ 

8.2 圣. 路易斯联邦储备银行在它网页上出版所选择的利率及美国的金融数据.网 址是： 

http :// research.stlouisfed.org/fred2 / . 

考虑固定期限为 1 年和10年的国库券的月利率，时间从1953年4月至2000年10月 
共571个观 测值： 见文件 m - gslnlO . tiet :. 利率是用百分比表示的. 

(«) 令 Q = n — r , ,为月利率 r , 的变化量序列.对两个变化量序列构造一个二元自回 
归模铟.讨论模型所殖含的意义，并将模型转换为结构形式. 

( b ) 对两个变化量序列建立一个二元滑动平均模型.讨论这个模型所蕴含的意义，并与前 
面的二元 AR 模型的结果比较. 

8.3 再次考虑固定期限为1年和10年的国库券的月利率，时间从1953年4月至2000年10 
月共571个观测值.考虑数据的对数序列，并对序列建立一个 VARMA 模型.讨论所得 
模型蕴含的意义. 

8.4 再次考虑固定期限为1年和10年的国库券月利率,时间从1953年4月至2000年10月 
共 5 H 个观测值.这两个利率序列是门限协整的吗？利用利差 5 t = r 10 . t - r M 作为门限 
变童,其中 n t 指具有固定期限 i 年国厍券利率.如果它们是门限协整的,对两个序列建立 
—个多元门限模型. 

8-5 二元 AR(4) 模型 a; t — ^ 4^-4 = + a t 是一个周期为 4 的特殊季节模型， {a t } 是独立 

同分布的正态随机变量序列.均值为0,协方差矩阵为 I ：.这种季节模型在研究公司的季 
度收入时可能有用. 

( a ) 假设 *, 是弱平稳的，试推导心的均值向量与协方差矩阵. 

( b ) 推导： r , 弱平稳性的充分必要 条件. 

( c ) 证明对^ > 0, r 4 = < t >, r e 4 l 其中 r , 是的证迟为 f 的自协方差矩阵. 

8.6 二元 MA (4) 模沏 a :, = a, - ©., a ,_ 4 是周期为4的另一个季节模型， { a «> 是独立同分布 
的正态随机变量序列，均值为0,协方差矩阵为 E . 试对/ = 0,... ,5,推导: c , 的协方差 
矩阵 IV 

8.7 考虑固定期限为1年和3年的美国国库券1953年4月至2004年3月的月利率，数据可 
以从圣.路易斯联邦储备银行或者文件 m-gsln3-5304.txt (1 年期和3年期数据）获得. 
也可以参见例8.6,其中它利用了一个更短的时间区间.这里我们直接利用利率序列而不 
作对数变换. 定义 xt = ( z u ， a ： 2 t )', 其中是一年期利率， ar 3 t 是3年期利率. 

(«) 为该二元利李序列识别一个 VAR 模型，并写卜所拟合的模型. 
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( b ) 计算所拟合 VAR 模型的脉冲响应凼数.用前6个延迟值就足够了. 

( c ) 利用所拟合的 VAH 模型计算利率序列的向前1歩到向前12步预测，预测原点为 
2004年3月. 

( d ) 当利用一个带限制的常数项时，这两个利串序列是协整的吗？在5%的显著水平下进 
行检骑. 

(e) 如果序列是协整的， 给 序列建立一个 ECM 模型，并写下所拟合的模型. 

(f) 利用所拟合的 ECM 模型计算利率序列的向前 1 步到向前 12 步预测.预测原点为 
2004 年 3 月. 

( g ) 比较分别由 VAR 模型和 ECM 模型所得到的预测. 
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第 9 章主成分分析和因子模型 

许多金融组合包含多个资产，它们的收益率同时并动态地依赖于许多经济和金 
融变量.因此利用合理的多元统计分析方法来研究组合收益率的行为和性质很重 
要.然而，如前几章所述,对多元资产收益率的分析通常需要高维统计模型，而这些 
模型很复杂并且很难应用.为了使多元收益率的建模更加简单，本章讨论一些降低 
维数的方法来寻找这些资产的内在结构.一般来说、降低维数最常用的统计方法是 
主成分分析 ( PCA ). 我们的讨论也从该方法开始.实际中所观测到的收益率序列通 
常呈现出相似的特征，这使得人们相信它们是由共同的因素驱动的.这些共同的因 
素称为公共因子.为了研究资产收益率的共同形式和简化组合分析，许多文献给出 
了很多因子模型来分析多元资产收益率.本章的第二个目的是引进一些有用的因子 
模型，并说明它们在金融中的应用. 

有二种类型的因子模型可用来研究资产收益率.参见 Conn 0 r (1995) 与 Camp - 
bell ， Lu 和 MacKial ay (1997〉. 笫•种类型是宏观经济因子模型.该模型利用宏观经 
济变量来描述资产收益率的共同的行为，其中，这些宏观经济变量包括 GDP 增长 
率、利率、通货膨胀率以及失业人数等.由于该类模型的因子可以观测，从而可以 
利用线性回归的力法米估计模型.第>种类型是基本面因于模型.该类模型用企业 
或资产的具体属性来构建公共因子.例如企业规模、账面价值与巾场价值以及产业 
分类.第三种类型是统计因子模型.该类模型把公共因子看成是需要用收益率序列 
估计的不可观测的变量或稳变量.本章将讨论这三类因子模型以及它们在金融中 
的应用 . Alexander (2001) 与 Zivot 和 Wang (2003) 也讨论了资产收益率的主成分 
分析和因子模型. 

本章的结构安排如下： 9.1 节介绍资产收益率的一般因子 模型; 9.2 节讨论宏观 
经济因子模型并给出一些简单的 例子； 基本面因子模型及其应用在 9.3 节中 给出; 
9.4 节介绍统计因子分析最基本的方法——主成分分析（在多元分析中它是用来 
降低维数 的)； 9.5 节讨论正交因子模型，包括因子旋转及其估计，并给出了 例子; 最 
后，节介绍渐近主成分分析. 

9.1 因子模型 

假定有) fe 个资产和 r 个时间周期 . 表示资产 i 在第 f 个时间周期内的收益. 
因 子模型 的一般形式为 

Tit = 0!< + 0ilfit + . •. + Pimfmt + [it ， t = • M , T \ t = 1, • ■ • , fc , (9.1) 
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其中 《• 是常数表示截距， { f jt \j = 1，... ， m } 是 m 个公共因子，如是资产 i 在因 
子 j 上的负荷，是资产 i 的个性因子. 

对于资产收益率，假定因子 / t = ,/ mt ) '是 m 维平稳过程，满足 

E= (/*) = /*/， 

COv (/ t ) = S /, mxm 矩阵. 

资产的个性因子〜是白噪声序列，并且与公共因子/#和其他个性因子不相关.具 
体地，我们假定 

E (^) = 0, 所有的 i 和*， 

Cov ( fit ,£ i a ) = 0 , 所有的 j , t, i |0 3, 
f 、 / ，若 < = <7 •且 t — 

•，… ) = ( o .其 他. 

因此，公共因子与个性因子不相关，并且个性因子之间也是不相关的.然而在一些 
因子模型中并不要求公共因子之间是不相关的. 

在某些应用中，资产的个数 A : 可能比时间周期的个数 r 大.我们将在 9.6 节分 
析这样的 数据. 在因子分析中通常假定因子之间是序列不相关的，从而 rt 也是序 
列不相关的.在应用中，如果观测到的收益率序列是序列相关的，则可以用第8章 
的模型消除序列相关性. 

(9.1) 式的因子模型可以写成下述矩阵 形式： 

r it - + ( Sift + eu , 

其中汍 = (知，…，/ 3 im r ， t 时刻 fc 个资产的联合模型是 

r t = at + e t , * = 1, - • - , T , (9.2) 

其中 r t = ( r lt ，...， r * t )’，/3 = [/3 0 _]是 A : x m 因子负荷矩阵， e t = ( f lt ， … ，〜)' 是 
误差向量且 Cov ( et ) = D = diag { a ?, …， oj } 是 A : x fc 对角矩阵.从而，收益率 r* t 
的协方差矩阵为 

Cov ( r t ) = /3 E - j - D . 

如果因子 / Jt 是可以观测的，则 （9.2) 式的这种模型表示具有横截面回归的形式. 

把 （9.1) 式的因子模型看作时间序列，对第 i 个资产我们有 

Hi = ail r - f - (9.3) 

其中抝= ( m ，... , r x j)\i = 1 T 是所有元素都为 1 的 7 1 维向量. F 是 

Txm 矩阵且其第 * 行是/丨，取= ( eii , … ,£ irY - E { 的协方差矩阵 Cov ( JSi ) = of / 
是 rxr 对角阵. 

最后， （9.2) 式可改写为 

rt = (g t + e t , 
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其中义 = (1, /!)', € = [ a , /?1 是 fc x (m + 1) 矩阵.对上式取转置并把所有的数据放 
在一块 ， 则可以得到 

•R = G《’ + ■£?, (9.4) 

其中是： T x A 收益率矩阵，其第 f 行是汁或等价地其第 i 列是由 （9.3) 式定义 
的抝； G 是: T x (m + 1) 矩阵，其第*行是心 B 是 r x A : 个性因子矩阵，其第< 
行是岭如果公共因子 / t 可以观测，则 （9.4) 式是多元线性回归模型 （ MLR ) 的一 
种特殊形式 • 参见 Johnson 和 Wichern (2002). 对于一般的 MLR 模型，不要求 e , 
的协方差矩阵是对角阵. 

9.2 宏观经济因子模型 

由于宏观经济因子模型中的闵子是可以观测的，从而可以利用最小二乘方法来 
估计 (9.4) 式的 MLR 模型估计为 

€’=[,'] =( G , G )- 1 ( G , R ). 

从中可以很容易地得到 a 和/3的估计. (9.4) 式的残差为 

E = R- Gi'. 

基子对模型的假定， e < 的协方差矩阵可以由下式 估计： 

D = diag (^£7 /(T - m - 1))， 

其中 diag ( A ) 表示由矩阵 A 的对角线元素所构成的对角 矩阵. 进一步地， （9.3) 式 
中第个资产的妒为 

l ^ E ]- 

R - square , = 1 ㈤ 叫:十 i = 1，， fc ， 

其中 A ,.， 表 ?! K 矩阵>1的第 （ i ， i ) 元. 

泮意到先前的估计并没有要求个性因子彼此不相关.因此一般来说所得到 
的估计不是有效的然巧加上正交化限制经常需要大量的计算，而且通常是可以忽 
略的.我们可以检査 EE/(T - m 1) 的非对角线元素来验证所拟合模型的充分 
性. 

9.2.1 单因子模型 

金融中最著名的宏观经济因子模型是市场模型.参见 Sharpe (1970). 该市场 
模型就是下述单因子 模型： 


ru = a, + Ar/vrt + eu, i = !,•••, A:; t = !,••• ,r, 


(9-5) 
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其中^是第 i 个资产的超额收益率， r m £ 是市场的超额收益率.为了进一步说明， 
考虑13只股票的月收益率 并日把 S & P 500 指数的收益率作为市场收益率.表 9«1 
给出了所用到的股票及其代码.样本区间是从 1990 年 1 月到 2003 年 12 月，因此 
fc =13 ,T = 168. 我们利用二级市场上的三个月期国库券的月收益作为无风险利率 
来计算股票和市场指数的超额收益.这些收益宇均以百分比的形式给出. 


表 9-1 单因子模型分析中所用到股票及其代码 


Tick 

Company 

f(tr r ) 

Tick 

Company 

f(CT r ) 

AA 

Alcoa 

1.09(9.49) 

KMB 

Kimberly-Clark 

0.78(6.50) 

AGE 

CAT 

F 

A.G.Eki wards 
Caterpillar 

Ford Motor 

1.36(10.2) 

1.23(8.71) 

0.97(9.77) 

MEL 

NYT 

PG 

Mellon Financial 
New York times 
Procter&Gamble 

1.36(7.80) 

0.81(7.37) 

1.08(6.75) 

FDX 

FedEx 

1.14(9.49) 

TRB 

Chicago TYibime 

0.95(7.84) 

OM 

QenerAl Motors 

0.64(9.28) 

TXN 

Texas Instrument 

2.19(13.8) 

HPQ 

Hewlett-Packard 

1.37(0.42) 

SP5 

S&P500 index 

0.42(4.33) 


a 表中还给出了超额收益率的样本均值和样本标准差 . 样本区间是从 1990 年 1 月到 2003 年 12 月 . 


我们用 S - Plus 来执行上一小节所讨论的估计方法.所用的大部分命令都能在 
免费软件 R 中应用. 

> da=matrix(scan(file= # m-fac9003 . txt # ) # 14) 

> (da) 

> xmtx=»cbind(rep{l, 168) ， x 【， 14]) 

> rtn=x[ # l ： 13] 

> xit: .hat 二 solve (xmtx # rtn) 

> beta.hat=t(xit.hat [2,]) 

> E.hat=rtn-xmtx%^%xit,hat 

> D.hat=diag(crossprod(E•hat) / (168-2)) 

> r.square-1-(1G0-2)♦D.hat/diag(var(rtn,OumSquares^T)) 

> t (rbind (beta. hat, Bqrt: (D. hat) , r. square)) 



beta.hat 

sigma(i) 

r.square 

AA 

1.292 

7,694 

0 

347 

AGE 

1.514 

7.000 

0 

415 

CAT 

F 

0.941 

7.725 

0 

219 

1.219 

8.241 

0 

292 

FDX 

0.80b 

8.854 

*> 

135 

GM 

HPQ 

1.046 

8.130 

0 

238 

1.628 

9.469 

0 

358 

KMB 

0.550 

6.070 

0 

134 

MEL 

1.123 

6.120 

0 

388 

NYT 

0.771 

6.590 

0 

205 

PG 

0.469 

6.4B9 

0 

090 

TRB 

0.718 

7.215 

0 

157 

TXN 

1.796 

11.474 

0 

• 316 


下®给出 / 第；个资产收益率的 /3 i ， af 和 R 2 的估计. 

图 9~1 给出了 13只股 票么和 i ? 2 的条形图.金融股票 AGE 和 MEL 以及高 
科技股票 HPQ 和 TXN 似乎有较高的和炉.另一方面， KMB 和 PG 有较低的 
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/3和 fl 2 . 丑 2 的变化范围是从 U . ( 〕 9 到 0.41. 这表明市场收益对每只股泉变化的解 
释少于50%. 



( b ) W 



图 9*1 对13只股票的月超额收益拟合单因子模型时芦和/? 2 的条形图： （ a ) 冷的条 形图； （ b ) 
« 2 的条 形图. S & P 500 指数的超额收益率作为市场指数.样本区间是从1990年1月 
到2003年 i 2 月 


在市场模型中，7^的协方差矩阵和相关矩阵可以如下 估计： 

> cov.r=var (x[ # 14] ) ♦ (t (beta. hat) %*%beta. hat) -fdiag (D. hat) 

> ad.r-sqrt(diag(cov.r)) 

> corr.r=cov.r/outer(sd.r # sd.r) 

> print(corr.r # digits=l,width=2) 



AA 

AGE 

CAT 

F 

FDX 

GM 

HPQ 

KMB 

M£L 

NYT 


PG 

TRB 

TXN 

AA 

1.0 

0.4 

0.3 

0.3 

0.2 

0.3 

0.4 

0.2 

0.4 

0.1 

0.2 

0.2 

0.3 

AGE 

0.4 

1.0 

0.3 

0.3 

0.2 

0.3 

0.4 

0 

2 

0 

4 

0 

3 

0 

2 

0 

3 

0.4 

CAT 

0.3 

0.3 

1.0 

0.3 

0.2 

0.2 

0.3 

0 

2 

0 

3 

0 

2 

0 

1 

0 

2 

0.3 

P 

0.3 

0.3 

0.3 

1.0 

0.2 

0.3 

0.3 

0 

2 

0 

3 

0 

2 

0 

2 

0 

2 

0.3 

FDX 

0.2 

0.2 

0.2 

0.2 

1.0 

0.2 

0.2 

0 

1 

0 

2 

0 

2 

0 

1 

0 

1 

0.2 

GM 

0.3 

0.3 

0.2 

0.3 

0.2 

1.0 

0.3 

0 

2 

0 

3 

0 

2 

0 

1 

0 

2 

0.3 

HPQ 

0.4 

0.4 

0.3 

0.3 

0.2 

0,3 

1.0 

0 

2 

0 

4 

0 

3 

0 

2 

0 

2 

0.3 

KMB 

0.2 

0.2 

0.2 

0.2 

0.1 

0.2 

0.2 

1 

0 

0 

2 

0 

2 

0 

1 

0 

1 

0.2 

MEL 

0.4 

0.4 

0.3 

0.3 

0.2 

0.3 

0.4 

0 

2 

1 

0 

0 

3 

0 

2 

0 

2 

0.3 

NYT 

PG 

0.3 

0.3 

0.2 

0.2 

0.2 

0.2 

0.3 

0 

2 

0 

3 

1 

0 

0 

1 

0 

2 

0.3 

0.2 

0.2 

0.1 

0.2 

0.1 

0.1 

0.2 

0 

1 

0 

2 

0 

1 

1 

0 

0 

1 

0.2 

TRB 

TXN 

CK2 

0.3 

0,2 

0.2 

0.1 

0.2 

0.2 

0 

1 

0 

2 

0 

2 

0 

1 

1 

0 

0.2 

0.3 

0.4 

0-3 

0.3 

0.2 

0.3 

0.3 

0 

2 

0 

3 

0 

J 

0 

2 

0 

2 

1.0 


我们可以将所估计的超额收益率的协方差矩阵和相关矩阵与其样本协方差矩 
阵和样本相关矩阵进行比较. 

> print ( cor ( rtn ) , digits =1, width =2) 

AA AGE CAT F FDX GM HPQ KMB MEL NYT PG TRB TXN 
AA 1.0 0.3 0.6 0.5 0.2 0.4 0.5 0.1 0.4 0.4 0.1 0.3 0.S 
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AGE 

0 

3 

1 

0 

0 

3 

0 

3 

0 

3 

0 

3 

0 

3 

0 

3 

0 

• 4 

0 

.4 

0 

2 

0 

2 

0 

3 

CAT 

0 

6 

0 

3 

1 

0 

0 

4 

0 

2 

0 

3 

0 

2 

0 

3 

0 

4 

0 

3 

0 

X 

0 

4 

0 

3 

F 

0 

5 

0 

3 

0 

4 

1 

0 

0 

3 

0 

6 

0 

3 

0 

3 

0 

4 

0 

4 

0 

1 

0 

3 

0 

3 

FDX 

0 

2 

0 

3 

0 

2 

0 

3 

1 

0 

0 

2 

0 

3 

0 

3 

0 

2 

0 

2 

0 

1 

0 

3 

0 

2 

GM 

0 

4 

0 

3 

0 

3 

0 

6 

0 

2 

1 

0 

0 

3 

0 

3 

0 

4 

0 

2 

0 

1 

0 

3 

0 

3 

HPQ 

0 

S 

0 

3 

0 

2 

0 

3 

0 

3 

0 

3 

X 

0 

0 

1 

0 

3 

0 

3 

0 

1 

0 

2 

0 

6 

KMB 

0 

3 

0 

3 

0 

3 

0 

2 

0 

3 

0 

3 

0 

1 

1 

0 

0 

3 

0 

2 

0 

3 

0 

3 

0 

1 

MEL 

0 

4 

0 

4 

0 

4 

0 

4 

0 

2 

0 

4 

0 

3 

0 

4 

1 

0 

0 

3 

0 

4 

0 

3 

0 

3 

NYT 

0 

4 

0 

4 

0 

3 

0 

4 

0 

3 

0 

2 

0 

3 

0 

2 

0 

3 

1 

0 

0 

2 

0 

5 

0 

2 

PG 

0 

1 

0 

2 

0 

1 

0 

1 

0 

1 

0 

1 

0 

1 

0 

3 

0 

4 

0 

• 2 

1 

0 

0 

3 

0 

1 

TRB 

TXN 

0 

3 

0 

2 

0 

4 

0 

3 

0 

3 

0 

3 

0 

2 

0 

3 

0 

3 

0 

.5 

0 

3 

1 

0 

0 

2 

0 

• S 

0 

3 

0 

3 

0 

3 

0 

2 

0 

.3 

0 

6 

0 

1 

0 

，3 

0 

• 2 

0 

1 

0 

2 

1 

0 


在金融中，可以利用全局最小方差组合 ( GMVP ) 来比较给收益率所拟合因子 
模型的协方差矩阵与收益率的样本协方差矩阵.对于给定的协方差矩阵 S ， 全局最 
小方差组合 u ; 是下述最优化问题 的解： 


nin <7 p w 满足 u/l = 1. 


解之可得 


E-4 
rs—4 


其中 1 是元素全为 1 的 A : 维向量. 

对于所考虑的市场模型.所拟合模型和数据的 GMVP 如下: 


> w.gmin.model = solve(cov.r) % * % rep(1,nrow(cov.r)) 

> w. gmin. model=w. gmin. model/sum (w. gmin. model) 

> t(w.gmin.model) 

AA AGE CAT F FDX GM 

tl,] 0.0117 -0.0306 0.0792 0.0225 0.0802 0.0533 


HPQ KMB MEL NYT PG TRB 

【 1,] -0.0354 0.2503 0.0703 0.1539 0.2434 0.1400 


-0.018S 


> w.gmin.dat:a=8olve(var (rtn) ) %*%rep(l # nrow (cov. r)) 

> w• gmin.data»w.gmin.data/sura(w• grain.data) 

> t(w.gmin.data) 


AA AGE CAT F FDX GM 

[1J -0.0073 -0.0085 0.0866 -0.0232 0.0943 0.0916 


HPQ KMB MEL NYT PG TRB TXN 

[1,] 0.0345 0.2296 0.0495 0.1790 0.2651 0.0168 -0.0080 


比较两个 GMVP . 给予 TRB 股票的权重变化很大.然而，这两个组合都给予 
KMB , NYT 和 PG 股票较大的权重. 

最后我们检査残差的协方差矩阵和相关矩阵以验证13只股票的个性因子不相 
关的假定.下面给山了残差相关矩阵的前四列，且在残差的交叉相关矩阵中有取 
较大值的元素，例如 Cor ( CAT , AA ) = 0.45 和 Cor ( GM , F ) = 0.48. 

> reai.covst(E.hac)%^%E.hat/(168-2) 

> resi . sds8qrt (diag(r<^fii . cov)) 

> resi•cor-resi.cov/outer(resi.sd 4 resi•sd) 

> print(reBi 
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9.2.2 多因子模型 

Chen ， Roll 和 Ross (1986) 考虑了股票收益率的多因子模型.所用的因子包括 
宏观经济变量的不可预知的变化或意外.这里不可预知的变化表示移除宏观经济 
变量动态依赖后所得到的残差.得到不可预知的变化的一个简单方法是为宏观经 
济变量拟合一个第8章中的 VAR 模型.为了进一步说明，考虑下列两个月宏观经 
济变量. 

(1) 城市居民的消费价格指数 ( CPI )： 包括所有项的指数，且指数 1982-1984- 

100 . 

(2) 16年及以上城市就业人数 ( CE 16)： 以千记. 

CP 1 和 CE 16 都己 经进行了季节凋整.数据的时间区间是从1975年1月到2003 
年12月.我们用更长的时间区间来得到变量的意外序列.对于这两个序列，我们 
通过取对数序列的一阶差分构造增长率序列.增长率序列以百分比的形式给出. 

为了得到意外序列.我们用 BK ； 准则来识别 VAR (3) 模型.这样，因于模型中 
所用的这两个宏观经济因子都是对数据拟合 VAR (3) 模型时从1990年到2003年 
的残差.对于超额收益率序列，我们仍然考虑前面所用到的13只股票.下面给出 
了分析的 细节： 

> da*matrix(scan(file= f m-cpicel6-dp7503.txt r ),2) 

> cpi=da 【 l ,】 

> cen»da 【 2 # ] 

> xl=cbind(cpi,cen) 

> yl*data•frame(xl> 

> ord.choice-VAR(yl,max.ar=13) 

> ord.choice$in£o 

ar(l) ar(2) ar(3) ar(4) ar(5) ar(6) 

BIC 36.092 36.093 20.234 46.241 60.677 75.810 

(7) ar(8) ar(9) ar(10) or(11) ar(12) ar(13) 

BIC 86.23 99.294 111.27 125.46 138.01 146.71 166.92 

> var3.fit=VAR(xl-ar(3)) 

> res=var3 . f it$residuals 【166 •• 333 # 1:2] 

> da=matrix (scan (file* ， m-fac9 003 • txt') , 14) 


2130780509762 

F2020040011010 

ooolooooooooo 

I 呼 一鑛 

T5301 557 897159 
^4002010100020 

ooloooooooooo 

嫌 • . 

E3031493660227 

Glooololoolool 

A. 

ol ooooooooooo 

I 猶 I 參 | 猶 ■ I 

0352044623529 
Aol 42012101111 


AAAGErFDXGMHPQEPGTRBTXN 








图 0 2 给出了 13只股票的 尽和 R 2 估计的条形图.有趣的是，所有的超额收 
益率与 CPI 增长率的不可预知的变化都是负相关的.这看起来是合理的.然而，所 
有超额收益率的7? 2 都很低，这说明这两个宏观经济变量对这13只股票超额收益 
率的解释能力很低. 

CPI 意外的 lieta CE1G 意外的 bct/i IP 



-14-13-10-8-6-4-2 0 -4-2 0 2 0.0 0.02 0.04 0.06 


图 9~2 对 13 只股票的月超额收益率拟合二因子模型时和 fl 2 的条形图.样本区间是从 
1990 年 1 月到 2003 年 12 月 

用下面的命令可以得到该二因子模型的协方差矩阵和相关矩阵的 估计： 

> cov.rtn*beta .hat%*%var (res) %*%t (beta.hat) 4-diag (D.hat) 

> sd.rtn«sqrt (diag(cov,rtn)) 

> cor.rtn » cov.rtn/outer(sd.rtn,sd.rtn) 

> print (cor. rtn t di it:a-1 # width«2) 

相关矩阵#常接近于单位矩阵，表明所用的二因子模型并不能很好地拟合这些 
超额收益率.最后，下面给出二因子模型残茇的相关矩阵. 
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如所料想.该相关矩阵非常接近千前而由原始超额收益率序列给出的相关矩 
阵 ： 故此处略去. 


9.3 基本面因子模型 


基本而因子模型用资产的可观测的具体属性构建公共因子来解释超额收益率. 
这些具体属性包括产业分类、企业规模、市场资本化、账面价值以及风格分类（增 
长率或值).对于基础因子模型,文献中有两种方法.第一种方法是由 BARRA 公司 
的创立者 Bar Rosenberg 提出的，称为 BARRA 方法.参见 Crinold 和 Kahn(2000). 
与宏观经济因子模型相反，该方法将观测到的资产的具体基本面作为因子在每 
个时刻 A 通过回归的方法估计因子 / t . beta 不随时间改变，但是 / t 随时间演变.第 
二种方法是由 Fama 和 French(1992) 提出的 Fama—French 方法.在该方法中，刈 
于给定的具体基本面，通过基于该具体基本面构造刘冲组合来得到因子 /#. 下面 
两小节中，我们简要讨论一下这两种方法. 

9.3.1 BARRA 因子模型 

假定超额收益率是均值修正的，从而因子实现也是均值修正的， (9.2) 式的因子 
模型退化为 


n =/5/t + e t , (9.6) 

其中 h 表示（样本）均值修正后的超额收益率序列，为了符号上的简化，这里继续 
用/ 1 作为因子 实现. 由于；9是给定的， （9.6) 式是有个观测和 m 个未知量的多 
元线性回归.由于公共因子的数目 m 应该小于资产的数目 A :， 从而回归是可以估计 
的.然而，回归不是齐次的，因为的协方差矩阵 D = dlag {(7?, ••- ,< r ^} 依赖于第 
i 个资产，这里 of = Var ( e , t )- 因此，时刻/的因子可以通过加权最小二乘 （ WLS ) 
方法估计，且权重为个性因子的标准误差.这样得到的估计为 


/e = 09i 厂 W’ry 以厂 Wh). (9.7) 


在实际中协方差矩阵 D 是未知的，从而估计时需要两个步骤 

第一步，在每个时刻 （ 利用普通最小二乘 (OLS) 方法得到 / t 的一个初步估计 

如下 

夂，广咖-讲,〉， 


其中第二个下标 o 表示 OLS 估计.该因子实现的估计是相合的但不是有效的. OLS 
回归的残差是 

C|,o = rt~ Pf t ,o- 

由于残差的协方差矩阵不随时间变化，从而我们可以将所有的残差放在一起（即对 
于* = 1， •“， r ) 来得到 d 的估计 
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^« = dia fi |} 

第二步，我们将估计嵌入以得到因子实现的修正估计 

ft, g = (9.8) 

其中第二个下标 g 表示广义最小二乘 ( GLS ) 估计，是 WLS 估计的一个样本版本. 
修正后回归的残差为 

^ = rt ~ 0ft.,g^ 

由此我们可以估计残差的协方差矩阵 

D y = diag I 11“小 

最后被估因子实现的协方差矩阵为 

5H - fy)Cf l<a - f 9 y, 

t=i 

其中 

h=^12ft,g- 

t=x 

由 (9.6) 式在 BARRA 方法下，超额收益率的协方差矩阵为 
Cov ( r t ) = y 3 S/〆 + 

1. 产业因于模型 

为了进一步说明，考虑10只股票的超额收益率，并用产业分类作为具体的资 
产基本面.表 9-2 给出了所用的股票.它们可以分为3个产业类别，即.金融服务、 
计算机和高科技以及其他类别.样本区间仍然是从1990年1月到2003年12月. 
在 BARRA 的框架下，有三个公共因子表示这三个产业类别，且 beta 是这三个产 
业类别的指示变量.即 


Tit = Ai/it + M 21 + Pi 3 ht + e it ， i = 1, … ， 10， (9.9) 


beta 为 


f 1, 若资产 i 属于第 j 个产业区 
i 0，其他 


(9.10) 


其中 j = 1,2,3分别表示金融，高科技和其他类别.例如， IBM 股票收益宇的 beta 
向量为 A 二 (0,1,0 y , Alcoa 股票收益的 beta 向量为汍= (0,0, 1/. 
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AGE 

C 

A.G.Edwards 
Citigroup 

1.36(10.2) 

2.08(9.60) 

IBM 

International Business 
Machines 

1.06(9.47) 

MWD 

Morgan Stanley 

1.87(11.2) 

AA 

Alcoa 

1.09(9.49) 

MER 

Merrill Lynch 

2.08(10.4) 

CAT 

Caterpillar 

1.23(8.71) 

DELL 

HPQ 

Dell Inc. 
Hewlett-Packard 

4.82(16.4) 

1.37(11.8) 

PC 

ProcterA; Gamble 

1.08(G.T5) 


a 超额收益率的样本均值和样本标准差也在表中 给出. 样本时间区间是从1990年1月到2003年12月. 
(9.9) 式中， / lt 是金融服务类的因子实现，/ 2 ,是计算机和高科技类的因子实现, 
ht 是其他类的因子实现•因为是指示变量,所以八的 OLS 估计非常简单.事 
实上，是由《时刻每个类别的超额收益率的平均值构成的向量.具体地， 

「 AGE t +C* + MDW t +MER t 1 


ft _ DELL f + HPQ t + IBM, 

AA t + CAT t + PG t 
- 3 . 

第 i 个资产的个性因子仅仅是其超额收益率与其所属产业类样本均值的差.于是 
可 g 得到残差协方差矩阵0的估计，并由此得到广义最小二乘估计.我们用 S-plus 
进行 分析. 首先,将收益率加载到 S - phis 中，移除掉样本均值，创建产业类哑元并计 
算收益率的样本相关矩阵. 

> da=matrix(scan(file= *m-barra-9003.txt # ,10) 

> rm = matrix(rowMeans(da),1) 

> rtn.rm = da - t(rm)%*%rep(1,168) 

> fin = c(rep(l,4),rep(0,6)) 

> tech » c (rep (0,4) , rep (1,3) , rep (0,3) 

> oth = c(rep(0,7),rep(1,3)) 

> ind.dum = cbind(fin,tech.oth) 

> ind.dum 

fin tech oth 
【1,】 100 
[2,】 1 0 0 
[3,] 1 0 0 


[ 8 , ] 0 0 1 

[9.] 0 01 

[10 J 0 0 1 

> rtn=t(rtn.rm) 

> cov.rtn=var(rtn) 

> sd.rtn=sqrt(diag(cov.rtn)) 

> corr•rtn=cov.rtn/outer(sd.rtn,sd.rtn) 

> print(corr.rtn,digits=l,width=2) 
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下面给出了 OLS 估计、残差和残差的方差估计. 

> F.hat.o ® solve(crossprod(ind.dum))(ind.dum)% # %rtn.rm 

> E.hat.o « rtn.rm - ind.dum%*%F.hat.o 

> diagD.hat.o«rowVars(E.hat•o) 

接下来便可以得到广义最小二乘估计. 
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由模型得到的产业类内的股票的相关矩阵要比样本相关矩阵大.例如，股票 
CAT 和 PG 的样本相关系数只有0.1，但是基于所拟合模型得到的相关系数是 0.6. 
图 9 3 给出了基于广义最小二乘估计给出的因子实现的时间图. 



图 9-3 对三个产业类的〖0只股票拟合 BARRA 产业因子模型所估计的因子实现 


2. 囚于模拟组合 

考虑带单因子的 BARRA 因子模型这种特殊情况•这里 （9.7) 式给出的力的 
WLS 估计提供了很好的解释.考虑 fc 个资产的组合 w ， 叫广 该组合是 

下述最小化问题 的解： 

miu ( ，满足 = 1. 

该组合问题的解由下式 给出： 

因此，被估因子实现是如下组合的收 益率： 

ft = uAv 

如果将组合 w 标准化，即满足叫=1，则称之为因子模拟 组合. 对多个因子的情 
况，可以对每个因子单独应用想. 

注释： 在实 际中. 超额收益率的样本均值经常与0没有显著的区别.因此，在 
拟合一个 BARRA 因子模型之前.通常不需要移除样本均值 口 
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9.3.2 Fama-French 方法 


对一个给定的资产基本面（例如账面价值与巾场价值的比率)， Kama 和 tVench 
(1992) 使用两个步骤来决定因于实现.首先，他们基十观测到的基本面的值将资产 
分类.然后他们构造了一个对冲组合.该组合持有分类资产前囱1/3的多头，且持 
有分类资产后面2/3的空头.对于给定的资产基本面， （ 时刻所观测到的该对冲组 
合的收益率就是所观测到的因子实现.对于所考虑的资产基本面重复上面的步骤. 
最后，给定观测到的因子实现 { f t \t = i ，...， r }, 并用时间序列的回归方法来估计 
每个资产的 beta. 为了解释超额收益率变动性的高百分比, Fama 和 French 确认了 
三个观测到的基本面.他们所用的三个基本面是 （ a ) 全部的市场收益率（市场超额 
收益率)； （ b ) 与大股票相关的小股票的业绩 ( SMB , 小的减掉大 的)； （ c ) 与成长型股 
票相联系的价值型股票的业绩 （ HML , 高对低).通过市场资产净值和市场资产净值 
对账面资产净值的比率来定义价值型股票和成长型股票.账面资产净值对市场资 
产净值的比率高的股票称为价值型股票. 

注释 r 不同因子樸型中因子的概念可能不同.在 Fama - FVench 方法中所用的三 
个因子是三个金融基 本面. 也可以将这些基本面组合起来构成股票的一个新的属 
性，并将所得到的樸型看作箏因子模型.这里之所以这样是因为所用的模型是线性 
统计模型.因此，在因子模型中当提到因子的个教时应该特别 注意. 另一方面，对 
于因子的个數.统计因子模型中有相当好的定义.下面我们将对此进行 讨论. 口 


9.4 主成分分析 


在多元时间序列分析中，一个重要的问题是对序列的协方差（或相关系数）结 
构的研究.例如，问量收益率序列的协力差结构在组合选择屮起着很重要的作用. 
下面，我们讨论一些统计方法.它们在研究时间序列的协方差结构时非常有用. 

给定一个 ifc 维随机向量 r = ( n ,〃. , r fc y , 其协方差矩阵为 则主成分分析 
(principal component analysis, 简记为 PCA) 关心的是利用 r, 很少的线性组合来解 
释 5^ 的结构.如果 r 表示 ifc 个资产的月对数收益率，则可用 PCA 来研究这 fc 个 
资产收益率变化的原因.这里关键词是很少，从而使得多元分析可以获得简化. 


9.4.1 PCA 理论 

PCA 对 r 的协方差矩阵 5^ 或相关矩阵仏都适用.因为相关矩阵是标准化 
随机变量 r* = S l r 的协方差矩阵,此处 S 是 r 的分量的标准差组成的对角矩阵, 
所以在我们的理论分析中使用协方差矩阵.令叫= 表示 k 维向量， 
这里 1 ， ... ， A:. 那么 


m - •一 
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是随机向量 r 的线性组合.若 r 由 A ： 只股票的简单收益率组成，则讲是对笫 j •只 
股票赋予权重之后所形成的组合的收 益率. 因为将 u ；, 乘上个常数并不影响 
分配到第 j 支股票上的权重，所以我们将向量 a 标准化，使得 = 1- 
利用随机变量线性组合的性质，我们有 

Var ( y <) = u ^ E r a ;“ i = l ，...， fc ， (9.11) 

Cov(y u yj) ^ i,j = !,■■■ t k. (9.12) 

PCA 的思想就是找到线性组合使得对 i / j 有队与吣是不相关的，并 且队的 
方差尽可能大.更具 体地： 

(1) r 的第一个主成分是在 w ^ u ；! = 1的限制下，使得 Var ( yi ) 最大的线性组合 
Vi = Mr; 

(2) r 的第二个主成分是在= 1与 Cov ( y 2 , yi ) = 0 的限制下，使得 Var ( i / 2 ) 
最大的线性组合 y 2 = 

(3) r 的第 i 个主成分是在 Lj^i = 1与 Gov ( y *. yj ) = 0,】• = 1 ，…， i - 1的限 
制下，最大化 Var ( y 0 的线性组合 yi = U [ r . 

因为 S ,. 的协方差矩阵是非负定的，所以它具有谱分解（见第 8 章附录 A ). 令 
( Ai ， ei ) … ( A fc ， e *) 为 5] r 的特征值（特征向量组)，其中\ > A 2 彡. .•彡 彡0,则 
我们有下面的统计结果. 

结果 9.1 r 的第 i 个主成分是 y , = ejr = ^ ijrj,i = 1，…， fc . 而且 

i=i 

Var ( yj ) = e - S r e ^ = A <, <=!,-•• , fc , 

Cov(j/t ,yj) = e[ S r ej =0, i^j. 

如果某些特征值 A , 是相等的.则对应特征向量 ei 的选择不是唯一的，从而讲 
也不是唯一的.另外，我们有 

k k k 

Var ( n ) = tr ( S r ) = Yl Xi = H Var ⑹. (9.13) 

<=i <=i t=i 

等式 (9.13) 说明 

Var ( yi ) = A , 

f ： Var ( r ,)"" Al *^" + Afc . 

i^=i 

因此， r 的总方差中由第 i 个主成分解释的比例是 £ r 的第；个特征值占 S r 的所 
有特值总和&的 比率. 也可以计算由前 t 个主成分所能解释的总方差的累积比例 

(即士 AjJAEA ,), 实际中,可以选择一个较小的使得前面的累积比例很大. 

i — 1 
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因为 tr ( p r ) = k , 所以当采用相关阵来进行主成分分析时，由第 i 个主成分解 
释的方差比例变为 K / k . 

PCA 的一个副产品是&或&的0特征值表明 r 的分量之间存在精确的 
线性关系.例如，如果最小特征值& = 0,则由结果 9.1 知 Var (^) = 0. 因此， 
y k ='t ^ 是个常数.从而在 r 中只有 fc - 1个随 机置. 在这种情形下， r 的维 
数可低.由于这个原因.文献中常用 PCA 作为降低维数的工具. 

9.4.2 经验的 PCA 

应用中，收益率向量 r 的协方差矩阵 S r 和相关矩阵化是未知的，但在一些 
正则性条件下，它们可以通过样本协方差矩阵和样本相关矩阵相合地估计.假定收 
益率是弱平稳的，且数据为 { r t \t = h - , T }, 则我们有如下 估计： 

T T* 

tr = \a ijt r\ = 占亡 (n - f)(n-f/, (9.14) 

1 e=i t=i 

p r = S X ±rS \ (9.15) 

其中右 = 是由 r t 的样本标准差构成的对角矩阵.从而 
可以利用计算对称矩阵的特征值和特征向量的方法来进行主成分分析.现在大多数 
统计包都能进行丰成分分析.在 S ^ Plus 中，进行主成分分析的基本命令是 princomp ， 
在 FinMetrics 中则为 mfactor . 

例 9.1 考虑 IBM , Hewlett - Packard , Intel Corporation , Merrill Lynch 与 Morgan 
Stanley Dean Witter 从 1990 年 1 月至 1999 年 12 月的月对数收益芊.此收益率以 
百分比表示，五包括红利.数据集共有120个观测值.图9 4给出了这5种月收益 
率序列的时间图.如所料想，同一工业部门的公司收益率倾向于展现出相似的模式. 

用 r *=( IBM ， HPQ , INTC , MER , MWD ) 表示这些收益率，其样本均值向量为 
(1.47,1.97,3.05,2.30,2.36)^, 样本协方差矩阵和样本相关矩阵为 
' 73.10 

36.48 103.60 

S r = 27.08 48.86 113.96 , 

16.06 37.59 27.96 105.56 

16.33 40.72 26.86 85.47 109.91 

1.00 

0.42 1.00 

Pr = 0.30 0.45 1.00 . 

0.18 0.36 0.26 1.00 
0.18 0.38 0.24 0.79 1.00 
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_ (a) IBM _ 

1990 1992 1994 1996 1998 2000 

年 

齋 10 
荽一 2 (i 

年 

^ ( c ) INTC 

SJ 

年 

S 邛 

1=58 

年 

5 貂 

年 

图14以下5个公司月对数收益率的时间图，其中对数收益率以百分比表示且包含分红，时 
间区间是从 1990年 1 月至 1999年 12 月： ( a ) IBM ; ( b ) Hewlett - Packard ; ( c ) Intel ; 
( d ) Merrill Lynch ; ( e ) Morgan Stanley Dean Witter 

表 O - 3 给出了利用协方差矩阵和相关矩阵进行主成分分析的结采.还给出了特 
征值、特征向量以及由主成分解释的变 化比. 考虑相关矩阵.并用丨和6来表不 
样本特征值与特征向置.对前两个主成分，我们有 

又 I = 2.456, e t = (0.342,0.474,0.387,0.503, 0.505 )’， 

A 2 = 1.145 ， e 2 = (0.525,0.314,0.405, -0.481, —0.481)，. 

这两个成分大约解释了数据全部变化的72%,且它们具有有趣的 解释. 第一个成 
分^股票收益率的一个大致为等权重的线性组合.这个成分可能代表股票巾场的一 
般运动，从而是一个市场成分.第二个成分代表两个工业部门 （ 即技术和金融服 
务）的差.它可能是个工业成分•利用 r 的协方差矩阵也可以发现主成分的类似 
解释. 

应用中确定主成分个数的一个非正式但是很有用的方法是检査斜坡图 (scree 
plot ). 它是特征值之按由大到小次序排列之后的时间图（即夂对的图).图 9_5 a 
给出了例 9 . i 屮的 5 种股票收益牟的斜 坡图. 通过在斜坡图中寻找转弯处，这表明 
余下的特征值相对较小并大致看上去是相同的，所以我们可以选择一个恰当的主 


(C) MWD 



(*1) MER 




(«») HPQ 
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a 特征向最进以列向量形式给出的. 

(a) 5 个股票收益率 (b ) 个偾券指数收益率 



m 9 - 5 两个5维资产收益率的斜坡图 ： （ a) 例 9.1 中的 序列； （ b) 例 9.3 中的债券指数收益率 

注释： 将例 9.1 中的数据扩展到2003年12月，对扩展后的数据进行主成 
分分析所得到的结果与例 9.1 中给出的结果基本一样，因此略去了.下面给出了在 









9.5 统计因子分析 371 


S-Plus 中进行主成分分析的命令. S-Plus 给出了特征值的平方根，并将其作为标准 
差. 

> da » matrix ( scan { file =, m - pca 5 c -9003. txt ,),6) 

> rtn = t(da[1:5,1) 

> pca.cov = prlnconq: (rtn) 

> names(pea.cov) 

> summary(pca.cov) 

> pea•cov$loadings 

> ocreeplot(pea.cov) 口 

9.5 统计因子分析 

我们现在转向统计因于 分析. 多兀统计分析中的一个主要困难是“维数的祸 
害”.特别地，当模型的阶或时间序列的维数增加时，参数模型的参数数量也经常陡 
增. 通常要寻找简化方法来克服维数所带来的祸害.从实证的观点出发.多元数据 
经常表现出一些相似的模式，这表明数据中存在潜藏的共同结构.统计因子分析是 
文献中可以利用的简化方法之一.它的目的是识别几个因子，使得它们能够解释数 
据的协方矩阵差与相关矩阵中的绝大部分变化. 

传统的统计因子分析假定数据没有序列相关性.由于金融数据经常是以小于 
或等于一周的频率抽取的，所以经常违反这个假定.然而，这个假定对低频数据的 
资产收益率（如股票或市场指数的月收益率）看 h 去是合理的.如果违背了这个假 
定，则可以利用本书中讨论的参数模型消除数据的线性动态依赖，并对残差序列应 
用闵子分析 

下面，我们讨论基于正交因子模型 (orthogonal factor model ) 的因子分析.考 
虑第 i 期 A : 个资产的收益率= ( r u ， … . rfetY ， 并假定 r t 是弱平稳的，其均值 
为/ X ，协方差矩阵为 E r . 因子模型假定 r t 线性地依赖丁少数不可观测的随机变量 
ft 二 ( fit ， /«，...， fmt )’ 与 维附加嗓声 …, e kt y . 这里 m < fc , 是公 

共因子， Q 是误差.数学上,统计因子模型具有 （9.1) 式的形式，只是用均值收益 M 
代替截距 a . 因此因子模型有如下形式 

= - e t , (9.16) 

其中 ^=[^] fcxm 是因子负荷矩阵心是第；个变量在 j 个因子上的负荷，是 
r it 的个性误差.统计因子模型的一个关键特征是 m 个因子 / u 和因子负荷汰 j 都 
是不可观测的.正因为如此， (9.16) 式不是一个多元线性回归模型.尽管它看上去 
与多元线性回归模型相似. 

称 (9.16) 式的因子模型是一个正交因子模型，如果它满足下面的 假定： 

⑴ E (/ t ) = 0, Cov (/ t ) = 为 m x m 的单位矩阵； 

(2) E ( e t ) = 0, Cov ( e t ) = D = diagfa ?, - •， o ^} (即 £> 是 A : x A : 对角矩阵)； 
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⑶ / t 与 是独立的，从而 Cov ( f t , et ) = E ( f t e , t ) = O mx/k . 

在上述假定下,很容易看出 

E r = Cov(r e ) = E[(m)(r t -At)’] 

= E [(/9 / t + e t ) W t - hetY ] = ( 3 ^ + D (9.17) 

且 

Cov ( r tl / t ) = E [( r t - ti ) f t \ = mftft ) + E ( e t /；)=/3. (9.18) 

利用 (9.17) 式和 （9.18) 式，我们看出，对 (9.16) 式中的正交因子模型 

Var(r “)=范 + …+ "? m + 4 ， 

Cov(r“ ， r#) = /3n/3ji + …+ 

Cov(r«, f jt ) — /3 tj . 

由 m 个公共因子贡献的的方差部分％+• • .七 0 f m 称为共性方差 ( Communality ). 
r « 方差的剩余部分4称为唯一性方差或个性方差.令$ =/% + ••• +忠„为共 
性方差，它是第；个变量对 m 个公共因子的负荷的平方和. 分量； ^的方差变为 
Var ( r it ) = cj + g \. 

实际中，并非每个协方差矩阵都具有正交因子表示.换句话说，一个不具有任 
何正交因子表示的随机变量是存在的.而且，随机变量的正交因子表示并不唯 
—. 事实上，对任何满足 PP ' = P'P = J 的 m x m 正交矩阵 P ， 令矿=)9户， 
/?= JP 7" 则 

r t - /i = ftf t + e t = 0 PP ' f t + = (3* f \ +e t . 

另外 E (/:) = 0, Cav ( f ；) = P ^ CovC/JP = P P = I . 这样 ， /T 和穴对 r t 建立了 
另一个正交因于模型.正交因子表示的这种不唯一性既是缺点，又是因于分析中的 
一个优点.说它是缺点是因为它使得因于负荷的意义不确定了.它也是一个优点, 
因为它允许我们进行旋转来寻找具有良好解释的公共因子.因为 P 是一个正交矩 
阵，所以变换 f 是 m 维空间中的一个旋转. 

9.5.1 估计 

(9.16) 式中的正交囚子模型可以通过两种方法估计.笫一种方法利用前一节中 
的主成分分析.这个方法不要求数据的正态性假定，也不要求预先指定公共因子的 
个数.它对协力差矩阵和相关矩阵都是适用的.但是同 PCA 中所提到的一样，这 
个解通常只是一个近似.第二种估计方法是最大似然方法.它利用正态密度，并要 
求顸先指定公共因予的个数. 
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主成分方法 

再次令 ( Xi , e x )^..， C \ k , e k ) 是样本协方差矩阵的特征值和特征向量对，其 
中人，> \ > •.. >夂.令 m < A 为公共因子的个数，则因子负荷矩阵由下式给出 

3 = [ Pij ] = ， v / A 2 e 2 , • • • , . (9.19) 

个性方差的佔计是 f 阵 t r - ^ 的主对角线上的元素.即办 = diag 何，…，沿， 
其中矸 = 〜, r - f 筇， 么&是 钆的第 （ M ) 个元素.共性方差的估计为 

i 一 1 

苟 = 忠 +… +A ? m. 

由近似产生的误差矩阵为 

tr - C ^ + D )- 

我们当然希望这个矩阵接近于 0. 可以证明 i: r - + D ) 的元素的平方和小于 

或等于 A ^ +1 + • • -f AJ . 因此，近似误差的上界为所忽略的特征倌的平方和 • 

由 (9.19) 式的解.基于主成分方法的因子负荷估计并不随着公共因子爪的增 
加而改变. 

最大似然方法 

如果公共因子和个性因予 e < 是联合正态的，那么 r < 是多元正态的，且其 
均值为…协方差矩阵为 S r = 在 f 3' D 1 (3 - A (它是一个对角矩阵）的 

限制卜，可以利用最大似然方法得到/3和£>的估计.这里#是由样本均值估计的. 
对这个方法的细节，读者可以参考 Johnson 和 Wichern (2002). 

在利用最大似然方法时，公共因子的个数必须事先给定.在实际中，可以用修 
正的似然比检验来检査所拟合的 m - 因子模型的充分性.检验统计量是 

LR ( m ) = 一 |r - 1 - i (2 fc + 5) - |mj (In |± r | - In + J ^|). (9.20) 

在 m 个因子的零假设下，上述检验统计量的渐近分布是自由度为 I [( fc - m ) 2_ /t _ m] 
的卡方 分布. 我们将在 9.6.1 小节讨沦选择 m 的一些方法. 2 

9.5.2 因子旋转 

正如前面提到的，对任何 m x m 正交矩阵 P ， 
r t - /x = f 3 f t + e t =/9 # /t 
其中 ^*=/3 P , f ； = P f f t . 另外， 

0 f 3' \ D = /3卽/3 ,十 £> = (3*((3 *Y + D 

这个结果 说明： 共性方差与个性方差在正交变换下保持不变.因此寻找一个正交 
矩阵 P 来变换因子模型使得公共因子具有良好的性质就是合理的.这样一个变 
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换等价于将公共因子在 m 维空间中旋转.事实上，有无限个可以利用的因子旋转. 
Kaiser (1958) 提出了一个方差最大化准则 (Varimax criterion ) 来选择旋转.这在许 
多应用中都运作地很好.记= [/351 是旋转后的因子负荷矩阵， c ? 表示第 i 个共 
性方差. 定义屯= fltj / c , 为经过共件方差 （ IK ) 平方根的尺度变换之后的旋转系 
数.方差最大化方法是选择对角矩阵 P ， 使得下式最大化 

i=i L*=i \<=i / 

这个复杂的表示有一个简单的解释.最人化 V ，对应于尽可能多地分散每个囚子负 
荷的平方.因此，此方法是为了在因子负荷的旋转矩阵的任何列屮寻找大的但可以 
忽略联合功效的组.在实际应用中，使用因于旋转来帮助解释公共因于.这在一些 
应用中可能有益，但在其他应用中未必有用.对十因子旋转有许多吋用的准则. 

9.5.3 应用 

给定资产收益率的数据 { rth 因子分析使得我们能够找到一些公共因于来解 
释收益率变化.由于因予分析假定数据没有序列相关性，所以在使用因于分析前应 
该检验这个假定的正确性.为此，我们可以使用多元混成统 计童. 如果发现有序列 
相关性，则可以构造一个 VARMA 模型来消除数据中的动态相依性，并且对残差序 
列运用因子分析.对许多收益率序列，线性模型残差的相关矩阵经常非常接近于原 
始数据的相关矩阵.在这种情形下,动态依赖对因子分析的影响是可以忽略的 • 
本小节考虑 3 个例子.前 2 个例子用 Minitab 软件进行分析，第 3 个例子用 
S-Plus 分析. 也可以用其他程序包. 

例 9.2 再次考虑例 9.1 中使用的 IBM, HewLett-Parkaxd, Intel, Merrill Lynch 和 
Morgan Stanley Dean Witter 的月对数股票收益率.为了检验序列不相关的假设，我 
们计算混成统计量得到 Q 5 (l) = 34.28, Qd4) = 114.3n, Q 5 (8) = 216.78. 与自由度 
为 25, 100 和 200 的 x 2 分布比较，这些检验统计量的 P 值分别是 0.102,0.156 和 
0.198. 因此，即使在 10% 的水平下都不能拒绝序列无关的假设. 

表 9-4 给出了基于相关矩阵运用主成分方法和最大似然方法的因子分析结果. 
我们假定共同因子的个数是 2. 根据例 9.1 中的主成分分析，这种取法是合理的.从 
表中可见，因子分析揭示了几个有趣的发现. 

• 由主成分方法识别的两个因子比最人似然方法识别的因子解释了更多的变 
差. 

• 根据旋转后的因于负荷，两种方法对数据基本上识别了同样的两个公共因子. 
金融股 （Merrill Lynch 和 Morgan Stanley Dean Witter) 对第一个因子的负 
荷很大，而技术股 （ IBM ， Hewlett-Packard 和 Intel) 对第二个因子的负荷很 
大.这两个旋转后的因子联合区分了工业部门. 




最大似然法 

IBM 0.191 0.496 0.087 0.524 

HPQ 0.394 0.G89 0.247 O.T55 

INTC 0.250 0.511 0.141 0.551 

MER 0.800 0.072 0.769 0.232 

MWD 0.094 —0.015 0.976 0.186 



比例 


a 收益率包含分红，时间是从1990年1月到1999年12 月. 分析基于样本交叉相关阵并假定有两 
个公共因于. 

例 9 . 3 在这个例子中，我们考虑期限为30年、20年、10年、5年和1年的美国 
债券指数的月对数收益率•例 9.2 中描述过这个数据，但被转换成了对数收益率.总 
共有696个观 测值. 正如例 9 .2中显示的，数据具有序列依赖性.然而,通过拟合一 
个 VARMA (2，1) 模沏来消除序列依赖几乎不对同步相关矩阵具有任何影响.事丈 
上.拟合一个 VARMA (2,1) 模型之前和之后的相关矩阵分别为 

" 1.0 1 F 1.0 ' 

0.98 1.0 0.98 1.0 

Po - 0.92 0.91 1.0 ， p- 0.92 0.92 1.0 , 

0.85 0.86 0.90 1.0 0.85 0.86 0.90 1.0 

. 0.63 0.64 0 67 0.81 1.0 J L 0.66 0.67 0.71 0.84 1.0 

其中 々 o 是原始对数收益率的相关 矩阵. 因此，我们直接对收益率序列应用因子 
分析. 

表士 5 中给出了数据因子分析的结果.对两种估计方法，前两个公共因子对数 
据总方差的解释都超过了 90%.事实上，高的共性方差说明对五种债券指数收益 


•247 
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• 在这个特例中，方差最大化的旋转并没有将最大似然方法识别的两个因子改 
变很多.然而由主成分方法识别的第一个非旋转因子被旋转去掉了.根据方 
差最大化准则背后的思想，这并不奇怪. 

• IBM 和 Intel 股票基于最大似然方法的收益率的个件方差相当大，从而暗示 
了这两只股票有一些特征值得我们进一步研究. 

表 9-4 IBM, HewLett-Packard , Intel, Merrill Lynch 和 Morgan Stanley Dean 
Witter 的月对数股累收益率的因子分析 a 


823023 > 4588 
.2.6.3.6.Q 
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最大似然法 


0.895 

0.430 

0.985 

0.876 

0.451 

0.970 

0.744 

0.547 

0.584 

0.837 

0.895 

1.000 

0.342 

0.747 

0.675 


主成分法 


0.253 

0.927 

0.333 

0.240 

0.922 

0.345 

0.140 

0.860 

0.429 

一 0.142 

0.704 

0.660 

-0.585 

0.325 

0.936 


变童 3.918 0.607 2.538 1.987 4.525 

比例 _ 0.784 _ 0.121 _ 0.508 _ 0.397 _ 0.905 

a 时间是从1942年1月到1999年12月.分析基丁样本交叉相关阵，假定有两个公共因了. 

例 9.4 再一次考虑表 9-2 中的10只股票的月超额收益率.时间区间是从1990 
年1月到2003年12月，收益率以百分比的形式给出.我们的目的是用 S - Plus 命 
令 factaual 演示一下统计因子模型的应用.我们从二因子模型开始,但是 (9.20) 式 
的似然比检验拒绝了二因子模型的假设.检验统计暈是 LR (2)=72.96. 基于自由度 
26的渐近卡方分布，检验统计量的 P 值接近为零. 

> da=matrix(scan(file* # m-barra- 9003 .txt # ) # 10) 

> rtn»t(da) 

> stat,fac=factanal(rtn f tactors«2 # methods^mle•) 

> stat.fac 

Sums of squares of loadings : 

Factorl Factor2 


Component names : 

M loadings" M uniquenesses" u corrplatinn w "criteria 1 * 
” factors" "dof w "method” "center” "scale" "n.obs” 
” scores" ” call" 


变最 4.281 0.504 3.059 1.726 4.785 

比例 0.856 0.101 0.612 0.345 0.957 


率而言，其个性方差都非常小.因为两种方法的结果接近，故我们只讨论主成分方 
法.非旋转因子负荷说明： （ a ) 所有5种收益序列对第一个因子的负荷粗略地 相等; 
( b ) 对第二个因子的负荷与期限长短是正相关的.因此，第一个公共因子代表了一 
般的美国债券收益率，第二个因子体现了 “期限”效应.而且，第二个因子负荷的和 
接近于 0. 因此，这个公共因子也可以解释为长期债券与短期债券的比较.这里一 
个长期债券指的是期限为10年或更长的债券.对旋转后的因子，其负荷也是有趣 
的.对第一个旋转因子的负荷与期限成正比例，而对第二个因子的负荷与期限成反 
比例. 

表 9-5 期限为 30 年、 20 年、 10 年 . 5 年和 1 年的美国惯券指数的月对数收益率的因子分析 « 

^ 因子负荷的佔计 旋转因 子负荷 — 共^^差 

/» h n n 1 - <r i 


138603123 
5 4 3 0 1 

ddo.o.d 

III 


9 7 623 
m8589(kx81 

o.o.o.l.d 


年年年年年 

3020 10 5 1 


970968934931982 

o.o.o.o.d 


5254565500 
9 9 9 9 8 

o.o.o.o.d 


年年年年年 

3020105 1 
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接着应用一个三因子模型，在5%的显著性水平下该模型似乎是合理的. LR (3) 统 
计量的 p 值是 0.089 2. 

> stat.fac=factanal(rt:n, factor-3 # method^ ^ mle r ) 

> stat.fac 

Test of the hypothesis that 3 factors are sufficient 
versus the alternative that more are required: 

The chi square statistic is 26.48 on 1R degrees of freedom. 

The p-value is 0.0892 

> summary(stat.fac) 

Importance of factors ： 


Factorl 

Factor2 

Factor3 

SS loadings 2.635 

1.82b 

1.326 

Proportion Var 0.264 

0.183 

0.133 

Cumulative Var 0.264 

0.446 

0.579 

Uniquenesses : 

AGE C MWD MER 

DELL HPQ 

IBM 

0.479 0.341 0.201 0.216 

0.690 0.346 

0.638 


AA CAT PG 
0.417 0.000 0.885 


Loadings : 

Factorl Factor2 Factor3 


AGE 

0 

670 

0 

217 

0.121 

C 

MWD 

0 

739 

0 

259 

0.213 

0 

817 

0 

356 


MER 

0 

819 

0 

329 


DELL 

0 

102 

0 

547 


HPQ 

0 

230 

0 

771 


IBM 

0 

200 

0 

515 

0.238 

AA 

0 

194 

0 

546 

0.497 

CAT 

0 

198 

0 

138 

0.970 

PG 

0 

331 





因子负荷也可以用下述命令 yplotdoadingsbtat . fac )) 在图上表示出来，即图 
从图中可以看出因子1本质上代表佥融服务类，而因子2主要由高科技类 
和 Alcoa 股票的超额收益率构成，因子3很大程度上依赖于 CAT 股票和 AA 股票 
的超额收益率.因此代表剩余的产业股. 

用命令 rotate 可以进行因+旋转.该命令允许许多种旋转方法.由命令 p redict 
可以得到因子实现. 

> stat.fac2 = rotate(stat.fac,rotation* ， quartiraax 。 

> loadings(stat.fac2) 

Pantorl Pactor2 Pactor3 
AGE 0.700 0.171 

C 0.772 0.216 0.124 

MWD 0.844 0.291 

MER 0.844 0.264 

DELL 0.144 0.536 
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HPQ 

0.294 

0.753 


IBM 

0.258 

0.S18 

0.164 

AA 

0.278 

0.575 

0.418 

CAT 

PG 

0.293 

0.334 

0.219 

0.931 


> factor.real^predict(stat.fac,type= # weighted.ls # ) 

最后基于所拟合的二因子统计因子模型可以得到这 10 只股栗超额收益率的相 
关矩阵.如所料想，与 9.3.1 节的产业因子模型所得到的相关矩阵相比,此处得到的 
相关矩阵与样本相关矩阵的对应部分更接近.可以用 GMVP 来比较收益率和统计 
因子模型的协方差矩阵. 

> corr.fit»fitted(stat.fac) 

> print(corr.fit,digita=l,width=2) 

AGE C MWD MER DELL HPQ IBM AA CAT PG 


AGE 

1.0 

0.6 

0.6 

0 

.s 

0.19 0.3 

0.3 0.3 

0.3 

0.2 

C 

MWD 

0.6 

1.0 

0.7 

0.7 

0.22 

0 

4 

0 

3 

0 

4 

0 

4 

0.3 

0.6 

0.7 

1.0 

0.8 

0.28 

0 

5 

0 

4 

0 

4 

0 

3 

0.3 

MER 

0.6 

0.7 

0 

.8 

1 

0 

0 

.26 

0 

b 

0 

4 

0 

4 

0 

3 

0.3 

DELL 

0.2 

0.2 

0 

.3 

0 

3 

1 

00 

0 

5 

0 

3 

0 

3 

0 

1 

0.0 

HPQ 

0.3 

0.4 

0 

*5 

0 

4 

0 

45 

1 

0 

0 

5 

0 

5 

0 

2 

0.1 

IBM 

0.3 

0.3 

0 

.4 

0 

3 

0 

31 

0 

5 

1 

0 

0 

4 

0 

• 3 

(K1 

AA 

0.3 

0,4 

0 

• 4 

0 

4 

0 

33 

0 

5 

0 

4 

1 

0 

0 

• 6 

0.1 

CAT 

0.3 

0.4 

0 

.3 

0 

3 

0 

11 

0 

2 

0 

3 

0 

6 

1 

• 0 

0.1 

PG 

0,2 

0.3 

0 

.3 

0 

3 

0 

03 

0 

1 

0 

1 

0 

1 

0 

• 1 

1.0 


因子 1 



HPQ DELL AA IBM MWD MER 



m 9-6 对表 9 2 中 10 只股票的月超额收益牢拟合一个三因子模型时的因子负荷图 
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9.6 渐近主成分分析 

到现在为止，关于 PCA 的讨论都是假定资产的个数小于所考虑时期的个数， 
即 /r < r . 为了处理: T 较小 fc 较大的情形， Conner 和 Korajczyk (19864988) 提出 
了渐近主成分分析 ( APCA ) 的概念.该方法与传统的 PCA 相似，但是依赖于资产 
数目趋于无穷时的渐近结果.因此 APCA 是基于下述 TxT 矩阵的特征值特 
征向量 分析： 

1 k 

« r = 甸(凡 -及广 

' t=l 

其中是由 （ 9 _ 3 ) 式所定义的第 i 个资产的时间序列 ， fl - ( l / k ) x E R ,. 换言 
之，是所用股票的平均收益率序列.另外，用 （9.4) 式的符号，我们有 M 

^ ® l* ： )(i2 - -R ® l^Y, 

其中 U . 是元素全为1的 A : 维 向量. Conner 和 Korajczyk 证明了当 A . 趋于无穷时, 
对 hr 的特征值一特征向量分析等价于传统的统计因子分析.换言之，因子的 
APCA 估计是的前 m 个特征向量.令龙表示由的前 m 个特征向量构成 
的 m x r 矩阵，则/,是尺的第 t 列. 利用类似于估计 BARRA 因子模型的思想， 
Conner 和 Korajczyk (1988) 建议按如下步骤修正估计 > t : 

0) 对= 1，... ， r , 利用样木协方差矩阵 lir 得到初始估计乂； 

(2) 对每个资产 t 给出模型 

r it = Oti + Pi ft + f = 1 ， •.. ， r, 

的 OLS 估计，并计算残差的方差 

(3) 构造对角矩阵 D = di a g {^ ，…，％}，并且将收益率进行如卜刻度变换 

R, = /?D - 1/2 

(4) 利用凡 计算下述 TxT 协方差矩阵 

合，= - H ,® 1；/, 

其中•是由的行内平均值所构成的向量 • 然后对进行特征值一特征向 
量分析来得到的修正估计. 

9.6.1 因子个数的选择 

文献中有两种方法来选择因子分析中因子的个数.第一种方法是由 Conner 和 
Korajczyk (1993) 提 出的. 该方法所用的思想是如果 m 是正确的因子个数，则当因 
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子个数从 m 变到 m + 1时资产个性误差 h 的横截面方差应该不会显著下降.第 
二种方法是 Bai 和 Ng (2002) 提出来的.该方法采用一些信息准则来选择因子个数. 
后一种方法基于这样一个观测到的 事实： hr 的特征值特征向量分析求解出了 
下述最小二乘问题 

假定存在 m 个因子，则 / t 是 m 维的.令 d ?( m ) 表示对资产 i 进行前面的最小 一 
乘问题的组内回归的残差的方差，这里要利用 APCA 分析中得到的定义残差 
的横截囱方差 如下： 

汐 2 ( m ) =! X^* 2 ( m )- 

K i=l 

Bai 和 Ng (2002) 给出的准则是 

Cyiim ) = a 2 { m ) 4 - mo - 2 ( M ) ^ ( jtTr ) 1 

C p 2 { m ) = a 2 ( m ) + ma 2 { M ) ( At ). 

其中 M 是事先指定的正整数，它表示因子的最大 个数； P fcr = min (>/ fc , v ^). 使得 
C pl ( m ) 或 C p 2 ( m ) 最小的 m 便是我们所要选择的因子个数，这里0 < m < M •实 
际中，这两个准则可能会选择不同的因子个数. 

9.6.2 例子 

为了进一步说明渐近主成分分析，考虑40只股票的月简单收益率，时间区间 
是从2001年1月到2003年12月，共36个观测.于是我们有 A : = 40, T = 36.表 
9-6 给出了这些股票的代码.这些股票是在2004年9月份的某一天在 NASDAQ 和 
NYSE 中交易频繁的股票.主要用到的 S - Plus 命令是 mfactor . 

表 16 渐近主成分分析中所用到的股票的代码，样本时间区间是从 


2001 年 1 月到 2003 年 12 月 



NASDAQ 

INTC 

MSFT 

SUNW 

CSCO 

AMAT 


ORCL 

SIRI 

COCO 

CORV 

SUPG 


YHOO 

JDSU 

QCOM 

CIEN 

DELL 


ERTS 

EBAY 

ADCT 

AAPL 

JNPH 

NYSE 

LU 

PPB 

NT 

BAG 

BSX 


GE 

TXN 

TWX 

XOM 

FRX 

Q 


F 

C 

MOT 

JPM 


TYC 

HPQ 

NOK 

WMT 

AMD 
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我们用前面所讨论的两种方法来选择因子个数. Conner 和 Korajczyk 提出的 
方法选择了 m = 1，而 Bai 和 Ng 提出的方法选择了 m = 6. 对于后一种方法，两 
个准则给出了不同的选择. 

> dim(rtn) % rtn is the return data. 

[1] 36 40 

> nf.ck^mfactor(rtn,k= # ck # # max•k 卿 10,•05> 

> nf,ck 
Call ： 

mfactor (x « rtn, k = "ck. ，， max.k = 10, aiy = 0.05) 

Factor Model: 

Factors Variables Periods 
1 40 36 

Factor Loadings : 

Min. 1st Qu. Median Mean 3rd Qu. Max. 

F.l 0.069 0.432 0.629 0.688 1.071 1.612 

Regression R-squared ： 

Min. 1st Qu. Median Mean 3rd Qu. Max. 

0.090 0-287 0.487 0.456 0.574 0.831 

> nf • bn=mfactor (rtn,lc= ， bn ， ， max• k=l0, sig=0.05) 

Warning messages : 

Cpl & Cp2 did not yield aame result.The smaller one is used. 

> rtf. bn$k 
U] 6 

取 m = 6, 我们对收益率序列应用 APCA 可以得到斜坡图和被估收益率因子 

> apca « mfactor(rtn,k»6> 

> apca 
Call ： 

rafactor(x = rtn, k = 6) 

Factor Model: 

Factors Variables Periods 


6 40 36 

Factor Loadings: 



Min 

1st Qu. 

Median 

Mean 

3rd Qu. 

Max. 

F.1 

0.048 

0.349 

0 

.bbl 

0.643 

0. 

952 

2.222 

P.2 

-1.737 

0.084 

0 

.216 

0.214 

0. 

323 

1.046 

F.3 



■ 


jWl 

El 

255 

1.093 

F.4 






m 

202 

0.585 

F.5 


WSSSm 

m 

• 056 

Wfi 

m 

214 

0.729 

F-6 



■ 

.003 


■ 

fm 

0.635 


Regression R-squared ： 

Min. 1st Qu. Median Mean 3rd Qu. Max. 

0.219 0.480 0.695 0.651 0.801 0.999 

> screeplot.mfactor(apca) 

> fplot(factors(apca)) 

图 g -7 给出了 4 0 支股票收益率的 APCA 的斜坡图 • 6 个公共因子大约解释了 
变化的89.4%.图 9-8 给出了 6个被估因子的时间图. 
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19-7 对 40 只股票的月简单收益率进行 APCA 的斜坡图 . 样本时间区间是从 2001 年 1 
月到 2003 年 12 月 


因子收益 




!9 8 对 40 只股栗的月简单收益率进行 APCA 所得到的因子收益的时间图.样本时间区 
间是从 2001 年 1 月到 2003 年 12 月 


练习题 

1 考虑 Merck&Company, Johnson&Johnson, General Electric, General Motors, Ford Mo¬ 
tor Company 股票以及市值加权指数的月对数收益率.收益率以百分比的形式给出并且包 
括分红 . 时间区间是从 1960 年 1 月到 1999 年 12 月 . 数据在文件 m-mrk2w.txt; 中，共有 
6 列，且排列顺序跟前面列出的一样 . 
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(a) 用样本协方差矩阵对数据进行主成分分析. 

(b) 用样本相关矩阵对数据进行主成分分析. 

(c) 对数据进行统计因子分析.识别公共因子的个数，并利用主成分分析方法和最大似然 
方法估计因子负荷. 

9.2 文件 m-excess-cl0sp-9003.txt 中包含 10 只股票和 S&P500 指数的月简单超额收益率. 
利用二级巾场上的 3 个月期国库券利举米计算超额收益.样本时间区间是从 1990 年 1 月 
到 2003 年 12 月，共 168 个观测.文件中的 11 列分别包含 ABT, LLY, MRK, PFE, F, 
GM, DP, CVX, RD, XOM 和 S&P500 指数的起额收益率.利用单因子市场模型分析 10 
只股票的超额收益率.对于每只股票，画出其 beta 和 fl 2 的估计.利用全局最小方差俎合 
比较所拟合模型的协方差矩阵和数据的样本协方差矩阵. 

9.3 再次考虑文件 m-MceBS-ci0Bp-9003.txt 中 10 只股票的超额收益率股票来_三个产业 
部门. APT , LLY . MRK 和 PFE 是主要的制药公司， F 和 GM 是汽车公司.剩下的为大 
的石油公司.利用 BARRA 产业因子模型分析这些超额收益率.画出三因子实现的图像, 
并说明模型的充分性. 

9.4 再次考虑文件 m-excesa-clOsp-SOOS.txt 中 10 只股票的超额收益举，对其进行主成分分 
析并画出斜坡图.共有几个公共因子？为什么？解释每个公共因子的含义. 

9.5 再次考虑文件 m-exce83-cl08p-9003.txt 中 10 只股票的超额收益率，对其进行统计因子 
分析，在 5% 的显著性水平下要用到多少个公共因子？画出所拟合模型的被估因子负荷图. 
这些公共因子有意义吗？ 

9.6 文件 m-fedip.txt 包含从 1954 年 7 月到 2003 年 12 月的联邦基金有效年利率和月利率以 
及工业生产指数. T 业生产指数已经经过了季节 调整. 用联邦基金利率和工业生产指数作 
为宏观经济变 S 为文件 m-excess-cl0sp-9003.txt 中 10 只股票的超额收益串拟合一个宏 
观经济因子模型.可以用 VAR 模型來得到宏观经济变量的意外序列.解释所拟合的因了 
樓型. 
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第 10 章多元波动率模型及其应用 

本章将第3章中的一元波动率模型推广到多元情形，并讨论一些方法来简化 
多个资产收益率波动率过程之间的动态关系.多元波动率在金融中有许多重要的应 
用.它们在组合选择与资产分配中非常重要，而且可以用来计算包括多个资产的金 
融头寸的风险值. 

考虑多元收益率序列 { r ( }. 我们采取与一元情形相同的方法将序列改写为 

Tt = H t + 

这里是在给定过去信息 Ft - i 下的条件期望, o ■，— ( a lt , … , a kl Y 
是序列在 Z 时刻的扰动或新息.假定^过程服从第8章中多元时间序列模型的条 
件期望过程.对大多数收益率序列，对 / x t 采用一个带外生变量的简单向量 ARMA 
结构就足够了，即 

P Q 

fi t = Tx t + ^ ^,r t -i - (10.1) 

*=1 i=l 

这里心 表不 m 维外生变量（解释变量）向童，其中: r lt = 1， T 是 fc x m 矩阵，且 
p 、 q 为非负整数.我们称 (10.1) 式为 r t 的均值方程. 

在给定 Am 下 at 的条件方差矩阵是一个 fc x A : 的正定矩阵 S t ， 定义为 

= Cov ( o t | F t _ i ). 

多元波动率的建模关心的是 S , 随时间的演变.我们对 S , 指定一个模型称为 
收益率序列 r , 的波动率模型. 

将一元波动率模型推广到多元情形有许多种方法.但是维数所带来的“祸害” 
很快成为应用中的一个主要阻碍，因为对一个维收益率序列而言，中有 fc(fc + 
1)/2 个量_为进一步说明，对于一个5维的收益率序列，中有15个条件方差与 
条件协方差.木章主要介绍一些相对简申的多元波动率模型.它们很有用而且在实 
际应用中容易处理.尤其是，我们讨论了一些允许资产收益率间的相关系数是时变 
的模型.时变相关性在佥融中很有用.例如，它们可以用来估计一个收益率序列市 
场模型的时变系数沐 

10.1 节首先用指数加权方法來估计协方差矩阵.这样估计的协方差矩阵可以 
作为多兀波动率估 il 的基准 . 10.2 节讨 论文献中已有的一元 GARCH 模型的一些 
推广. 10.3 节介绍两种波动率建模中重新参数化 S t 的方法.基于 Cholesky 分解的 
重新参数化是非常有用的 i 0.4 节以 GARCH 模型为例研究了二元收益率的波动 
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率 模型. 在这个特例中，波动率模型可以是二维或三 维的. 10.5 节主要关注吏高维 
收益率的波动率 模型. 10.6 节强调了降低维数的 问题. 10.7 节说明了多元波动率模 
型的一些应用.最后， 10.8 节给出了对波动率建模有用的多元学生一 t 分布. 

10.1 指数加权估计 

给定新息集合= { ai ，…， 〜」}，新息的无条件协方差矩阵可由下式估 
计： ^ 

这里七的均值理解为 0. 该估计对于和式中的每一项陚予相同的权重 l/(t-l). 为 
了允许协方差有时变性并且强调对越靠近的新息相关性越大，可以利用指数平滑的 
思想给出叫协方差矩阵的下述 估计： 

1 — A n 

红 = j—S (io.2) 

其中 0 < A < 1 且权重 （1 - A ) A ^- V (1- A 4 - 1 ) 之和为 1. 对于满足 A *- 1 « 0 的充 
分大的《，前面的估计可以改写为 

^ — (1 — 十 ASt-i- 

因此 1 (10.2) 式的估计称为协方差矩阵的指数加权滑动平均 (EWMA) 估计. 

假定收益率数据为 { ri ， …， r T }. 给定 A 和初始估计它 i ，则红可以递归计算 
出来.若假定 a t = r t - tx t 服从均值为0、协方差矩阵为 S , 的多元正态分布（这 
里叫是参数 © 的函数)，则可以用最大似然方法联合估计出 A 和这是因为数 
据的似然函数是 

lnL(0,A)oc -i^ln(|E t |) - ~ - tx t )\ 

t=l t=l 

用么代替 S t 可以递归地估算出上式. 

例 10.1 为进一步说明，考虑香港和日本的股票市场指数的日对数收益率.时间 
区间是从 1996 年 1 月 1 日至 1997 年 10 月 16 曰，共 469 个观测值.指数以美元度 
量，且收益率以百分比形式给出.选择这个样本段是为了避免亚洲金融危机的影响. 
该危机在 1997 年 10 月 17 日冲击了香港市场.数据来自于数据流 (Datastreara). 
图 1( M 给出了两个指数收益率的时间图.令 nt 为香港股票市场的指数收益率， r 2t 
为日本股票市场的指数收益率.如果采用一元 GARCH 模型，则我们得到以下模型 
ru = 0.090 - 0.094ri tt _e + Ou, a\ t = tr u e lt , 

= 0.126 + 0.1030? (1 _! + 0.818^^4 ， 


(10.3) 
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T2t = -0.046 + a2t, a2t = <T2t^2ti 

02t = 0.007 + 0.054a2,t-i 4 - 0.942«r2 rt _!, 10 . 4 ) 

其中除了收益率序列的常数项和口本市场收益率的以外的所有参数的估计在 
5%的水 T 下都是显著的.上述两个一元模型的标准化残差与残差平方序列的 Ljung - 
Bcix 统汁量并没有表明模型的任何不充分性.图 10-2 给出了前面两个一元 ( JAR - 
CH (1，1) 模型的波动率估计.香港股票市场看上去比日本股票巾场有更大波动性, 
但是日本市场在后半部分样本屮显示了波动率递增的趋势.香港市场和日本市场 
指数收益率基于模型的渐近标准差分别是 1.259 和 1.393. 数据的样本标准误差分 
别是1. 2 96和 1.067. 因此，日本市场指数收益率的一元模型过度估计了无条件波动 
率.这可能是由于 （104) 式中 IGARCH 模型的特征引起的，而 IGAHCH 模型特征 
的出现又可能是由于所观测到的数据后半部分波动率的跳跃. 


(») 香港 



图10~1香港和曰本股票市场指数的日对数收益率的时间图.时间区间是从19»6年1月1闩 
到1997年10月16日.收益率以百分比形式给出： （ a ) 香港市场： （ b ) 日本市场 

接卜来看二元模型.为了简单,我们忽略掉香港市场收益率延迟为6的小的序 
列相关性，并且用 EWMA 方法来得到波动率估计，这要用到 S-Plus FinMetrics 中 
的命令 mgarch: 

> hkja.ewma=mgarch l r formula.var » 一 ewmal, trace = F) 

Mean Equation ： rtn - 1 


Conditional Variance Equation ： - ewmal 
Coefficients : 

C{1) 0.06394 % Expected perc• return of Hong Kong market 
C(2) -0.05478 % Expected perc. return of Japanese market 
ALPHA 0.03711 


A 的估计是 1 — 6 = 1-0.037 11 « 0.963. 该值处于实际中常见的范围内.图 
10-3 给出 f 用 EWMA 方法估计出的波动率序列.与图 10-2 相比较， EWMA 方法 
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给出的波动率序列更为平滑，尽管在这两幅图中波动率具有相似的形式. 


㈤ 香港 



100 200 

天 


图10~2香港和日本股票市场指数日对数收益率的波动率（标准误差）的估计值.时间区间 
是从19%年1月1曰到1997年10月16日，收益率以百分比给出： （a) 香港市 
场； 日本市场.所用的模型是一元模型 


( a ) 香港 



300 411 () 

天 


图1化3香港和日本股票市场指数的日对数收益率波动率（标准误差）估计的时间图.时 
间区间是从1996年1月1日到1997年10月16日，收益率以百分比形式 给出; 
(a) 香港市场： （b) 日本市场.用到了指数加权滑动平均方法 

10.2 多元 GARCH 模型 

很多作 者已经 把一元 GARCH 模型推广到多元情形.本廿将讨论这些推广中 
的一部分.更多的细节，读者町以参考最近的综述性文献，如 Bauweris, Laurent 和 
Rorabouts(2004). 
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10.2.1 对角 VEC 模型 

Bolleralev, Engle 和 Wooldridge(1988) 推广了指数加权滑动平均方法并提出了 
下述 模型： m s 

取=十 E Ai © (at-ia^) + Bj © Et-j, (10.5) 

i=i 

其中 m 和 s 是非负整数， A 和巧是对称矩阵， 0 表示 Hadamard 乘积，即矩阵的 
相应元素相乘. （10.5) 式称为对角 VEC ( m ,«) 模型或 DVEC ( m ,«) 模型.为了进一 
步理解该模型，考虑满足下述关系式的二元 DVEC (1, 1) 模型 

^11,* 

0"21,t CT22,l 


ai . i - taa . t-i o ^ t-i 
1 

o*2l,t-i cr 2 2,t-i 
这里只给出了模型的下三角部分.模型可以具体写为 
= ^ u.o + + 

<721, t= ^21,0 + + B2l,lCT21,t-l, 

^22,( = 乂22,0 + + ^22,1°'22 1 < 1, 

其中 St 的元素只依赖于其过去值和 a t _, a ；_, 中的乘 积项. 也就是说， DVEC 模型 
的每个元素都服从 GARCH ( i , 1) 模型，从而该模型很简单.然而，它可能产生一个 
非正定的协方差 矩阵. 进一步地.模型不允许波动率序列之间的动态依赖性. 

例 10.2 为了进一步说明，考虑两个烟草公司的月简单收益率序列（包含分红). 
时间区间是从1965年1月到2003年12月，共有468个观测•令 r lt 表示 Pfizer 股 
票的收益率， r 2 t 表示 Merck 股票的收益率•图 10-4 给出了二元序列 n = ( ru ,^/ 
的时间图.图像表明该二元序列没有显著的序列相关性.因此， r< 的均值方程只包 
含常数项.在 S - plus 的 FinMetrics 中，用命令 mgarch 给序列拟合一个 DVEC (1, 1) 
模型. 

> rtn=cbind(pfe , mrk) % Output edited. 

> drug.dvec=mgarch(rtn-l # -dvec(1,1)) 

> summary (drug. dvec) 

Call ： 

mgarch(formula.mean = rtn - 1 # formula.var « - dvec(1 # 1)) 

Mean Equation ： rtn - 1 

Conditional Variance Equation ： - dvec(1 # 1) 

Conditional Distribution ： gaussian 

Estimated Coefficients : 

Value Std.Error t value Pr(>|t|) 


乂 11，1 


o 

. 义 21.1 

^224 

Bu,i 


o 

^ 21,1 

^ 22,1 


Au t o 

乂21，0 ^22,0 
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C ⑴ 0.0164424 3.422e-03 
C(2) 0.0150987 3.139e-03 


A(1 

A(2 

A(2 

ARCH(1; 1 
ARCH(1; 2 
ARCH(1; 2 
GARCHtl; 1 
GARCH(1; 2 
GARCH(1; 2 


1) 0.0008181 4.348e-04 

1) 0.0001021 4.979e-05 

2) 0.0001408 7.067e-05 
1) 0.0727734 2.973e-02 

1) 0.0259816 9.537e-03 

2) 0.0518917 1.753e-02 
1) 0.7777585 5.525e-02 

1) 0.9407037 2.191e-02 

2) 0.9203388 2.684e-02 


4.805 1.047e-06 
4.810 1.025e-06 
1.881 3.027e-02 
2.050 2.048e-02 
1.992 2.348e-02 
2.448 7.363e-03 
2.724 3.343e-03 
2.961 1.614e-03 
0.165 1.554e-15 
42.928 0.000e+00 
34.296 0.000e+00 


Ljung-Box test for standardized residuals : 

Statistic P-value Chi A 2-d.f. 
pfe 10.07 0.6096 12 
mrk 14.91 0.2461 12 


Ljung-Box test for squared standardized residuals： 

Statistic P value Chi^2 d.f. 
p£e 18.30 0.1068 12 

mrk 5.04 0.9566 12 

> names(drug.dvec) 

【1】 "residuals" *sigma.t w M df.residual H "coef" 

【5】 w model" "cond.dist w "likelihood" "opt.index" 

[9] "cov" "std.residuals" n R.t w "S.t" 


[13] "prediction 轉 ” call" 


"series" 


图 10-4 


(a) PFE 收益率 



1970 1980 1900 2000 

年 

(b) MRK 收益率 



1070 1980 1990 

年 


Pfizer 股票和 Merck 股票月简单收益率（包含分红）的时间图.时间区间是从 1965 
年 1 月到 2003 年 12 月： （a) Pfizer 股票： （b) Merck 股票 


从输出结果来看，所有的参数估计在5%的水平下都是显著的，所拟合的波动 

率模型为 o 

<7 n f t = 0.00082 + 0.073 a ^_ ^ + 0.778( Jii ， t — 1 ， 

< T2i f t = 0.00010 + 0.026 ai , 卜 ia2 , t - 1 + 0.941( X 21, 卜 i , 
a 22 ， t = 0.00014 + 0.052^^! + 0.920 eT 22 f t - i - 
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输出结果还给出了一些对单只股票收益率进行模型检验的统计量.例如， Pfizer 股 
票收益率的标准残差序列和标准残差平方序列的 Tjung - Rov 统计量分别为 Q (12) = 
10.07(0.61) 和 Q(12) = 18.30(0.11), 这里括号内的数字表示 p 值.这样,对两个收益 
率序列逐个检査所拟合的 模型， 不能拒绝 DVEC(1, 1) 模型.一种包含更多信息的 
模 M 检验方法是对该二元收益率序列的标准残差和标准残差平方序列应用多元 g 
统 计量. 对于这个特定的 DVEC(1, 1) 模型，我们有 Q 2 (10) = 42.04(0.38), Q5(10) = 
67.33(0.004), 其中表示二元标准残差平方序列的 g 统计董.基于二元统计量， 
在 5% 的显著性水平下均值方程是充分的，然而在 1% 的水 f 下，拒绝了波动率服 
从 DVEC(1, 1) 模型的假设•图 10^5 给山了所拟合波动率和相关系数序列的时间 
图.这些序列分别 在‘* signa . t " 和中进行了分类.相关系数的变化范围是 
0.42 〜 0.84. 

(«) PFE 波动率 




年 

图1心5为两个主要烟草公司的月简单收益率序列拟合 （1, 1) 模型时的被估波动率和被佔 
时变相关系数的时间图.时间区间是从1965年1月到2003年12月： （ a ) Pfizer 
股票波 动率； （ b ) Merck 股票波 动率； （ c > 时变相关系数 

10.2.2 BEKK 模型 

为了保证正定性限制， Engle 和 Kroner (1995) 提出了如下 BEKK 模型： 

rn a 

H t = AA' + Yl 4(a t 一 04 +1 (10.6) 

*=1 J =1 

其中 4 是下三角矩阵且 A 和 B , 是 A : x A ： 矩阵.基于模型的对称参数化，若 AA f 



980 1990 

年 

(b) MR.K 波动率 



.ln.09.08.07.(M) 


0^0 
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是正定的，则 S t 几乎处处正定.该模型允许波动率序列之间有动态依赖性.另一 
方面，模型有几个缺点.第一, 4,和中的参数关于股票或波动率的延迟值没有 
直接的 解释； 第二,参数的个数是 ^(m+ S )+A:(A: + l)/2, 它会随 m 和 S 的增大而 
迅速增大.有限的经验表明许多被估参数都是统计不显著的，这使得在建模中存在 
大最的多佘计算. 

例 10.3 为了进一步说明，考虑例 10.2 中 Pfizer 股票和 Merck 股票的月简单收 

益率，并对它们应用 DEKI<(1,1) 模型.再一次用 S-plus 进行估计. 

> drug.bekk~mgarch(rtn- 1 f -bekk(1 # 1)) 

> summary (dxxig .bekk) 

Call： 

mgarch(formula.mean = rtn - 1, formula•var = - bekk(1 # 1)) 

Mean Equation: rtn - 1 

Conditional Variance Equation： - bekk(1 # 1) 

Conditional Distribution： gaussian 


Estimated Coefficients : 





Value 

Std.Error 

t value 

Pr{>|t|) 


C(l) 

0.0164770 

0.003470 

4.749e+00 

1.369e-06 


C(2) 

0.0142816 

0.003172 

4.503e^00 

4.255e-06 

A(l, 

1) 

0.0245803 

0.008837 

2.782e+00 

2,815e-03 

A(2, 

1) 

0*0116134 

0.005953 

1.951ei*00 

2.584e-02 

A(2, 

2) 

0.0002018 

0.267625 

7.541e-04 

4.997e-01 

ARCH(1; 
ARCH(1; 

1 # 

1) 

0.2994052 

0.093304 

3.209e+00 

7,125e-04 

2, 

1) 

0.1952856 

0.075092 

2.601e+00 

4.802e-03 

ARCH(1; 
ARCH(1; 

1. 

2) 

-0.0818745 

0.097810 

-8.371e-01 

2,015e-01 

2, 

2) 

0.0929540 

0.082626 

1.125e+00 

1.306e-01 

GARCH(1; 

1 , 

1) 

0.8987843 

0.074407 

1.208e+01 

0.000e+00 

GARCH(1; 

2 t 

1) 

-0.0674587 

0.059B95 

-1.132e^00 

1.291e-01 

GARCH(1; 

1 , 

2) 

0.0163848 

0.046402 

3.531e-01 

3,621e-01 

GARCH(1; 

2, 

2) 

0.9089547 

0.040158 

2.463e+01 

0.000e+00 

Ljung-Box test 

for standardized residuals： 


Statistic 

P-value Chi A 2-d.f. 



pfe 

10. 

13 

0.6044 

12 



mrk 

15. 

25 

0.2270 

12 




Ljung-Box test for squared standardized residuals : 

Statistic P-value Chi^2-d-f. 
pfe 18.314 0.106E 12 

mrk 7.174 0.8459 12 

S-plus 给出的基于单个残差序列的模型检验统计量不能说明所拟合的 BEKK (1,1) 
模型是不充分的.用二元标准化残差，我们有 Q 2 (10) = 41.57(0.40), Q 5(10) = 
65.71(0.006). 类似于 DVEC (1,1) 模型，在1%的显著性水平下 Ljung-Box 统计量 
拒绝了该波动率模型.图1仏6给出了所拟合的波动率序列和 BEKK (1，1) 模型的时 
变相关系数.与图10^5比较，这两个拟合的波动率模型之间确实存在差别.例如, 
BEKK (1,1) 模型的时变相关系数似乎波动更大. 
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(a) PFE 股票波动率 



1970 1980 1990 2000 

年 

(b) MRK 股票波动率 



1970 1980 u 199U 2000 

年 


(c) 时变相关系数 



图 10*6 为两个主要烟草公司的月简单收益率序列拟合 BEKK (1, 1) 模型时的被估波动率 
(标准差）和被估时变相关系数的时间图.时间区间是从1965年1月到2003年12 
月； （ a ) Pfizer 股票波 动率； （ b ) Merck 股票波 动率； （ c ) 时变相关系数 


BEKK(1,1) 模型的波动率方程为 

<712,< ] = [ 0.025 0 1 [ 0.025 0.012 

a 2 i,t <722, t _ 0.012 0.0002 0 0.0002 

+ 0.299 -0.082 a 1 .t- 1 O 2 .t_! ' \ 0.299 0.195 

0.195 0.093 J [ al tt _ x \ -0.082 0.093 

+ [ 0.899 0.016 1 [ an ti -i a l2 ,t-i 1 [ 0.899 -0.067 * 

-0.067 0.989 J a 2 i,t-i a 22 .t-i 0.016 0.989 ’ 

其中有 G 个参数的估计在 5% 的水平下都是不显著的.特别地.常数矩阵 >1 仅包含 
一个显著的参数.进一步，我们需要进行矩阵的乘积来解释所拟合的模型. 


10.3 重新参数化 

给多元波动率建模时有用的一步就是利用 s t 的对称件将其重新参数化.我们 
考虑 s t 的两种重新参数化方法. 

10.3.1 相关系数的应用 

对的第一种重新参数化方法是利用 a t 的条件相关系数和方差.具体地.我 
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们将写为 

St = Wij , t \ = Dtp t Dt , (10.7) 

其中 P , 是的条件相关矩阵， D t 是 kxk 对角矩阵，其元 素为叫 各分量的条件 
标准差[即 A = diagf^/STTX … . s /^ kkj }\ 

因为& 是具有单位对角元的对称阵，所以 S t 随时间演变是由条件方差 
与外 的元素控制的，其中 j < i ， i 彡 A :. 因此，对叫的波动率建模.只要 
考虑如的条件力差和相关系数就足够了.定义维向童 

S* = (cru,t, • - - , fffcfc.t, Qt)\ (10.8) 

其中^是对相关矩阵进行列拉直得到的 k{k - 1)/2 维向量，但是只利用了主 
对角下面的元素.具体写出来，对一个 k 维收益率序列， 

Qt = ( P 21， t ... iPki , t \ ,, f \ Pk , k - l , t )^ 

为进一步说明，对于 fc = 2,我们有込= P 2 U 且 

3t — (011,t ， C r 22,t ， P21,t ) , ， 

它是一个3维的 向量. 对 A : = 3,我们有= ( pax , t , P 3 i , i , p 32 , t ) / M . 

2t = (^22,t,^33,t, P2l,t, P31,t,P32,t)\ 

它是一个 6 维的随机向量. 

如果 a , 是二元正态随机变量，则 S , 由 (10.9) 式给出，而且％在给定 F , ! 
下的条件密度函数为 

/( ait , a 2t | St ) =- - 1 exp 

2 n ^ Jan ^22, t {^ - pll . t ) 

其中 Q{au,a 2t ,3 t ) = ^L + _^L_ 2 _ ，卿 ' 

CT ll，t «^22 ,t y /^ ll , t ^22 ,t 

与最大似然估计有关的 a t 的对数概率密度函数为 

/( a u ,« a e , S< ) = -i (^ + ^-^==)} 

( 10 . 11 ) 

这个重新参数化是很扃用的，因为它直接对协方差和相关阵建模.然而此方法也有 
几个缺点.第一，当 A : > 3时，似然函数变得非常复杂.第二，此方法在估计中要求 
带限制的最大化以保证 S t 的正定性.当 A : 很大时，这个限制将变得很复杂. 


<?(an ， a2t ， St) 
2(1 p \ i , t ) 


(10.9) 

( 10 . 10 ) 






10.3.2 Cholesky 分解 


Sr 的第二个重新参数化是利用 Cholesky 分解.参见第 S 章的附录 A . 这个方 
法在佔计屮有很多优点，因为它不会为得到&的正定性加任何的参数限制.参见 
Pourahmadi (1999). 另外，这种重新参数化方法是一个止交变换.所以似然凼数极 
其简单.下面给出变换的细节. 

因为&是正定的，所以存在一个具有单位对角元素的下三角矩阵&和具有 
正对角元素的对角矩阵 G ,， 满足 

= LtGiL ^. (10.12) 

这就是著名的的 Cholesky 分解.该分解的一个特征是心对角线以下的元素与 
G t 的对角元素都有良好的解释.我们通过仔细研究二元和三元的情形来说明这个 
分解.对二元情形.我们有 

卜 叫 ， Lt \ 1 0] ，卜 ， t 0 ’， 

0"21，t 0"22,t 」 1_ 921, t 1 」 [ 0 g22,t 

其中对 i = 1 和 2, 有批 t > n . 利用 （ 10 . 12 ) 式，我们有 

<r\ 2 ,t _ </n,t 92i,t5n,t 

戊 12 ，* ^ 22,t J [ q 2 \,tgn,t 922,t + 021, t9n,t 

令上述矩阵方程两边的元素相等.我们得到 



Cil,t = 9n,t, ^21, t = Q21,igu.t, cr 22 ,t = 9-22.1 + qh,t9n.i- 


解这个方程，我们有 


^21.1 ^91 t 

9n.t — ^n,t, 921, t = - ， 922,t = ^22,e - -• 

^ n.t ^ u.t 


然而,考虑简单的线性回归 


«2 f fta. u +&2 t ， 


其中 6^ 表示误差项.由著名的最小二乘理论，我们有 

Co\(ait,a 2 t) = <72i .t 
Var(a u ) a n / 


Var (6 2 0 


=Var(a 2 t) - /3 2 Var(ait) = mt - 


进一步，误差项 h 与回归项是不相关的.因此，利用 （10.14) 式.我们有 


921.t = 0, 922,t = Var(6 2 0, &2t 丄 ai t 
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其中丄表示不相关.总之， 2 x 2 矩阵的 Cholesky 分解相当于从 a ，到= 
( buMY 进行的一个正交变换,满足 

6it = «it 和 624 = — 02 i , tO-iti 

其中= /?是通过 (10.15) 式的线性回归得到的， Cov (6 t ) 是对角元素为你，》的 
对角阵.变换的量恤 , t 与队 t 可以作如下解释： 

(1) G t 的第一个对角元素恰是 < x lt 的方差. 

(2) G , 的第二个对角元素是 (10.15) 式简单线性回归中残差的方差. 

(3) 下三角矩阵 A 的元素 g 2 l . t 是 (10.15) 式中的回归系数/?_ 

对髙维情形，以上性质仍然成立.例如，考虑三维情形 



i 

0 

0 


ffn,t 

0 

0 

L t = 

021,t 

1 

0 

• G t = 

n 

922,1 

0 


931, t 

932,1 

1 


0 

0 

533,t 


由 ( 10 . 12 ) 式中的分解.我们有 

ffll.t CT 21 ,t 
0~21,t 0"22,t <^32.t 

<^31,t 0"32,i ^33.t 

= 921,t522,t Q21,tffn,t + 922,t 931,t921,tpu,t + Q32,t922,t 

Q3l,t9u t t Q3l,t<l2l,t9u,t + Q32,tg22,t 4 - 932,t522,t + ff33,t 

令上述矩阵方程两边的元素相等，我们有 


0*11.t = 9u,ti o- 2 i,t = Q 21 ,t9n,t, o" 22 .t = Q2i.t9n,t + 922 ,= Q3i,t9n,ti 

d 2 ,t = Q3l,tQ2l,t9n,t + Q32,t922,t, <^33,t = Q3l,t9U,t + Q32,t922,t + S33,t, 

或等价地， ^ 

9u,t = Cn.ti gai.t = 2I t • 997.1 = O'M.t — (fai.tffn.t* 


Q31J 


1 ( ^31,t^21,t\ 

.• 932,t — - ( <732,< - I • 

922,t \ J 


<^31 .t 

.933,< = ^33,1 - Q3l,t9ll,t - Q32,t922,t- 

这些量看起来很复杂，但是它们只不过是下述正交变换的系数和残差的方差 


fau = <»lt, b 2 t = fl2t — 02lbu, &3t = fl3t — 03lblt — /?32&2t. 






其中是下述最小二乘回归的系数. 
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a 2t = 02lbu -f &2T, flat = /?3l6lt + /?32&2t + &3*. 

换句话说，我们有他 t = Pij , ya,t = Var(6it) 且对 i 夢 j , 有 b it 丄 b Jt . 

根据前面的讨论，利用 Cholesky 分解相当于作一个从到 b t 的正交变换，其 
中= a lt , 且 6 it (l < i ^ k ) 是通过最小二乘回归递推定 义的： 

a it ― Qil.tbu 4- Qi2,t^2t + “ • + l)t I bit, (10.16) 

其中对于 1 彡 j < i , 奸 M 是下三角矩阵 h 的第 （ i , 力个元素. 

我们可以将这个变换写为 

bi = L ^ at , 或者 a t = Ltb tr (10.17) 

其中，如前所述， ir 1 也是一个具有单位对角元素的下三角阵 . 6 t 的协方差矩阵是 
Cholesky 分解中的对角阵 G t , 因为 

Cov(60 = = G t . 

在这样一个变换下，与波动率建模相关的参数向量变为 

Ef. = * • • ififfcfc.ti 921,931, t, Q32,ti' * * 1 VklJ> • * * , Qk(k-i),t)\ (10.18) 

它也是一个 k ( k - hl )/2 维的向量. 

前面的正交变换也大大简化了数据的似然函数.利用 | L t | = 1的事实.我们有 

|S t | = = |G,| = n^,,. (10.19) 

i=l 

如果在给定过去信息的条件下 a , 的条件分布是多元正态分布 N (0. S t ), 则变换后 
的序列~的条件分布是多元正态分布 N (0, G t ), 且数据的对数似然函数变得极其 
简单.事实上，我们有的对数概率密度为 

e{a t , S t ) = £(6 t , S t ) = E f^M) + ， (10.20) 

这里为 / 简便，忽略了常数项 ，且如 , t 为 h 的方差. 

利用 Cholesky 分解.将&重新参数化有几个优点.第一，由 （10.19) 式，如果 
对所有的 i ， 有讲 M > 0,则 S t 是正定的.因此， S , 的正定限制可以通过对 \ n ( g u , t ) 
而不是讲 u 建模很容易地得到.第二， (10.18) 式中参数向量 S t 的元素有良好的解 
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释.它们是使得扰动与收益率正交化的多元线性回归的系数与残差的方差.第三, 
与 a 2< 间的相关系数为 

^21,< _ w 

若 〆 0, 则 P2W 是时 变的. 特别地，如果 = C / 0, 则 P2W = 

假定方差比 cr u < t / a 22 , t 不是常数.则它仍然是时变的.若 r , 的维数大于2,时变性 
也适用于其他相关系数，并且时变性是将&重新参数化的两种方法间的主要区别. 
利用 (10.16) 式及变换后的扰动^之间的正交性，我们有 

= Var(a tt |F t _i) = ^v.tdw.u i = 1 ， … ， fc, 


(Tij.t = Cov(o u , a jt \F t -i) = qiv,tQjv,t9vv^ j < *, i = 2, •.. ， fc, 

V =1 

其中对 ， fc .， q vv , t = \. 这些方程给出了 在01 0 1辦1^分解卜的参数化. 

10.4 二元收益率的 GARCH 模型 

因为卩 j 以用同样的方法将许多一兀波动率模型推广到多兀情形，所以我们的讨 
论集中于多元 GARCH 模型.也可以用其他的多元波动率模型. 

对一个 A : 维收益率序列 r t , 多元 GARCH 模型利用“精确方程”来描述 k ( k-h 
1)/2 维向量各随时间的演变.精确方程的意思是这个方程不包含任何的随机扰动. 
然而.精确方程即使是在最简单的情形 A ： = 2时也可能变得很复杂,此时三,是三 
维的.为了保持模型的简单性.通常对方程加一些限制. 

10.4.1 常相关模型 

为 f 使波动率方程的个数较少 ， Bollerslev (1990) 考虑了相关系数非时变的特 
殊情形 ，即内 w =阳，其中< 1. 在此假定下， p 21 是一个常参数，从而对 
S ； = ( a n , t ,022, tY 而言.波动率模型包含两个参数 . S ; 的 GARCH ( l . l ) 模型变为 

2* = ato + 4* SJ 1 — j t (10.21) 

其中 a ? 1 = ( of a t )\ cro 是一个二维 IF 向量 . ft ati 和是 2 x 2 非负正 

定矩阵.更具体地.此模型可以更详细地表示为 


^n,t 


«10 

+ 

«11 0(12 


+ 

'0n 

Pi2 



<^22,« 


■ tt 20 


• «21 «22 

. a 2,i-l . 


.021 

(h2 




( 10 . 22 ) 
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其中对£ = 1和2,有叫 0 > 0.定义化= a ? - S 『， 我们可将前面的模型改写为 

a t = «o + («1 + Pi)a\_ x +Tj t - 

这是关于 a ? 过程的一个二元 ARMA (1,1) 模型.这个结果是第3章巾一元 
GARCH (1,1) 模型的直接推广.因此，模型 (10.22) 的一些性质可以从第8章中 
的二元 ARMA (1,1) 模型的性质中很容易地得到.特别地，我们有如下结果. 

(1) 如果 cm + A 所有的特征值都是正的，并小丁 • 1，则 < 的二元 ARMA (1,1) 

模型是弱平稳的，从而 E ( a ?) 存在.这意味着收益率的扰动过程 a t 有正定的无条 
件协方差矩阵 • 叫各分量的无条件方差是 {alalY = (r - a , - 且分量 

au 与 a 2 t 间的无条件协方差是 P 2\ CT \( T 2- 

(2) 如果=仿 2 = 0,则 a lt 的波动牟不依赖于 a 2 t 过去的波动率.类似地， 
如果 a 21 = /^ = 0,则 a 2 t 的波动率不依赖于 a lt 过去的波动率， 

(3) 如果叫和&是对角的，则此模型简化为两个一元 GARCH (1,1) 模型.此 
时，这两个波动率过程不再是动态相关的. 

(4) 可以利用向量 ARMA (1,1) 模型的预测方法类似地得到该模型的波动率预 
测.参见第3章中的一元情形•以/ I 为预测原点的向前1步波动率预测为 

2*(1) = at。 + otia 2 h 4- 

对向前〖步预测 1 我们有 

S ；； ⑷二叫+ ㈣ +足谇；；(卜 1), £>1. 

这些预测是对 a it 的边际波动率的预测 . ait 与 a 2 t 之间的向前1步协方差预测为 
P 2 iWuM ^22. h ( n ]°^ 其中 M 是的估计，叫,⑷是 E - M 的分量. 

例10. 4 再次考虑例 10.1 中的香港市场和 tl 本市场的日对数收益率.利用二元 
GARCH 模型，我们得到了对数据拟合较好的两个模型.第一个二元模型的均值方 
程为 

r it = _ 0.118n ， t 一 6 + ait, r2t = d2t- 

其中 AR (6) 系数的标准误差为 0.044. 第一个模型的波动率方程为 

0.275 0.112 . 1 f 0.711 

trn.t = (0.079) ( (0.032) FaJ^jl (0.068) 

^22,t 0.051 0.091 . 0.869 

[(0.014)J [ (0.026)」 [ (0.028) 

(10.23) 

其中小括号内的数值为标准误差 • a u 与 a 2 t 之间的相关系数的估计为 0.226, 标准 
误差为 0.047. 
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令= ( an ,^) 7 是标准化残差.其中知= d , 的 Ljung - Box 统计 
景为 Q 2 (4) = 22.29(0.10)， CK 8) = 34.83(0.29)，括号内的数表示 p 值.因为均值方 
程中利用了 AR ⑹系数.所以这里的 p 值分别基于自由度为15和31的 x 2 分布， 
d 2 t 过程的 Ljung-Box 统计量为 <9以4) = 9.54(0.85), QV 8) = 18.58(0.96). 因此，在 
模型 (10.23) 的二元标准化残差中没有序列相关性或条件异方差性.香港市场和曰 
本市场的两个残差的无条件新息方差分别是 1.55 和 1.28. 

(10.23) 式的模型给出了两个分离的波动率方程，这表明两个市场的波动竿不 
是动态相关的，但它们是同步相关的.我们将这种模型称为二元对角常相关模型. 
如果忽略掉香港市场收益率中很小的延迟为6的序列相关性，则用 S - plus 可以很 
容易地估计常相关 模型： 


> hkja.ccc=mgarch (rch 1 ， ccc(l,l), trace=F) 
>svunmary Chkja.ccc) 

第二个二 7 t GARCH 模型的均值方程为 


ru = -0.143ri.i_6 + ai t , r 2t = a 2tl 


其中 AR (6) 系数的标准误差为 0.042. 第二个模型的波动率方程为 



0.378 
(0.103) + 


0.108 

(0.030) 


0.172 

(0.035) 


, a 2.t 1 


0.321 


[(0.135) 


0.865 

(0.109) 

0.869 

(0.028) 



(10.24) 


小括号内的数值是标准误差 . 与 a 2t 之间的相关系数的估计为 0.236, 标准误 
差为 0.045. 如前一样定义标准化的残差，我们得到对于第二个模型的标准化残 


差 Q 2 (4) = 24.22(0.06), Q 2 {8) = 35.52(0.26); 对于标准化残差的平方 ⑷， 
17.45(0.29), 切⑻ = 24.55(0.79). 这些 Ljung Box 统计量在 5% 水平下都是不显 
著的，从而 (10.24) 式中的模型也是充分的.第二个模型中香港和日本市场新息的 
无条件方差分别为 1.71 和 1.32. 


与模型 (10.23) 比较，第二个二元 GARCH (1,1) 模型显示了两个市场之间的一 
种反馈关系，从而比较这两个模型是很有趣的.第一，模型 (10.24) 的新息的无条件 
方差接近于 (10.3) 式和 （瓜 4) 式的 结果. 第二，图 10-7 给出了模型 (10.23) 所拟合 
的波动率过程，而图 10^8 给出了模型 (10.24) 所拟合的过程.因为模型 （ 10.23) 意 
味着两个市场之阆的波动率没有动态依赖性，所以图107类似于图 10^2. 相反地, 
图 10~8 却给出了两个市场之间相互影响的证据.第三，模型 (10.23) 的对数似然函 
数最大值为 -535.13, 其中 < = 8 ， ". ， 469, 而模型 （ 10.24) 的对数似然函数最大值是 
-540.32. 参见 (10.11) 式中的对数概率密度函数.因此,如果用似然原理，则更喜欢 
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用模型 (10.23). 最后，因为两个二元波动率模型的实际含义有较大不同，为了区分 
它们需要做进一步的研究.这样的研究可能要使用一个更长的样本时期或包含更多 
的变最（例如使用一些 U . S . 市场的收益率). 


图 10-7 


图 10-8 


(«) 香港 






香港和日本股票市场指数日对数收益率的波动率的估计倌.时间区间是从 low ; 年 
1月1日到1997年10月16曰，收益率以百分比给出的： （ a ) 香港 市场； （ b ) 日本 
市场. 所用模型为 （10.23) 式 


( a ) 香港 



f) ioo 20 () iian 400 


天 
( b ) 日本 


脊3 

1 2 




200 


天 

香港和日本股票市场指数日对数收益率的波动率的估计值.时间区间是从1996年 
1月1日到1997年10月16曰.收益率以百分比给出的 ： （ a ) 香港市场： （ b ) 曰本 
市场.所用模型为 （10.24) 式 


例10. 5 作为第二个解释，考虑笫8章使用的 IBM 股票和 S & P5UU 指数月对数 
收益.时间区间是从 I 926 年 1 月至 1999 年 i 2 月，且收益率以百分比形式给出.令 
和『：》分别表示 IBM 股票和 S & P 500 指数的月对数收益.如果利用一个常相关 
的 GARCH (1,1) 模型，则我们得到的均值方程为 


r u = 1.351 + 0.072 ri , t_i + 0.055 ri , t _2 — 0.119 f 2, t — 2 + 勿“ f " 2t ~ 0.703 + a2t , 
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第一个方程中参数的标准误差分别为 0.225, 0.029, 0.034 和 0.044, 第二个方程中参 
数的标准误差为 0.155. 波动率方程是 



' 2.98 ' 


• 0.079 . 



' 0.873 —0.031 


o ' ll.t 


(0.59) 

+ 

(0.013) 


Kt-i 


(0.020) (0.009) 


O ' ll . t-l 

^22 , t 


2.09 


0.042 0.045 


• a lf — i . 


—0.066 0.913 




.(0.47). 


(0.009) (0.010) 



(0.015) (0.014) 



(10.25) 

小括号内的数值为标准误差常相关系数是 0.614, 标准误差为 0.020. 利用标准化 
残差，我们得到 Ljung-Box 统计量(^⑷= 16.77(0.21), Q 2 (8) = 32.40(0.30), 括号内 
的 p 值是分别从自由度为13和29的 x 2 分布得到的.这里的自由度已经调整了，因 
为均值方程包含三个延迟预测.对标准化残差的平方，我们有(5如）= 18.00(0.16), 
Q 5(8) = 39.09(0.10). 因此，在5%的显著水平下，标准化的残差 d t 没有序列相关性 
或条 件异方差性.该二元 GARCH (1,1) 模型表明这两个月对数收益的波动率之间 
具有反馈关系. 

10.4.2 时变相关模型 

常相关系数波动率模型的一个主要缺点是：在实际应用中，相关系数有随时间 
变化的趋势.考虑例 10.5 中使用的 IBM 股票和 S & P 500 指数的月对数收益率.我 
们很难有理由认为加权平均的 S & P 500 指数收益率与在过去70多年的 IBM 收益 
率保持一个常相关系数.图 10-9 利用120个（即10年）观测值的一个滑动窗口，给 
出了两个月对数收益率序列之间的样本相关系数.这个相关性随时间变化，且看上 
去近年来正在递减.相关性的递减趋势并不奇怪，因为 IBM 市场资本化在较大的 
美国工业公司中的排名近年来已经改变 .Tse (2000) 提出了一个拉格朗日乘子统计 
量来检验多元 GARCH 模型中常相关系数的假定. 



图 UM ) IBM 股票与 S & P 加0指数的月对数收益率的样本相关 系数. 这个相关系数是由120^ 
观察值的滑动窗口计算出来的.样本时间区间是 192(5 年1月至1999年12月 
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在 GARCH 框架内放松常相关限制的一个简单方法是对条件相关系数指定一 
个精确 方稈. 这可以利用 〗 0. 3 节讨论的 S , 的两种重新参数化方法,进而通过两种 
方法来进行.首先，我们直接利用相关 系数. 因为 IBM 股票和 S&P500 指数收益率 
间的相关系数为正，而且一定在区间[0，1]中，所以我们用方程 


P 2 \,t = 


exp(<?t) 

1 + exp(fy t ) 


(10.26) 


其屮 

qt = ruip2i, t -i H- ^2 ― ====, 

是扰动的条件方差.我们将此方程称为相关系数的一个 GARCH(1 ， 1) 
模型，这是因为它利用了两个扰动的1步延迟交叉相关系数与1步延迟交叉乘积. 
如果= G 7 2 = 0. 则模型 (10.26) 退化为常相关的情形. 

总之.时变相关的—•元 GARCH (1，1) 模型包含了两套方程.第一套方程包含了 
条件方差的一个二元 GARCH (1，1) 模型. 第二套方程是 （10.26) 式中相关系数的一 
个 GARCH (1,1) 模型. 实际中，如果相关系数为负，则可以在 (10.26) 式中添加一 
个负号.一般来讲，当相关性的符号未知时，我们可以利用相关系数的费希尔变换 
(Fisher Transformation) • 


(It 


Inf - 1 ， 陶 

\1~ P 2 l,t 


) 


或 P21,t = 


exp(g<) - 1 

exp ( 少 ）+ 1 


并对仿采用一个 GARCH 模型来对两个收益率之间的时变相关系数建模. 

例 10. S ( 续）对 IBM 股票和 S & P 500 指数的月对数收益率我们建立了 （10.25) 式 
的 GARCH (1，1) 模型.将 (10.26) 式增加到其中，并进行联合估计，则对两个序列我 
们得到下面的 模型： 


T it — 1.318 十 0,076ri,t —1 一 0.068r2 t e— 2 + d\t } 

T2t = 0.673 + a2t. 

第一个方程中三个参数的标准误差分别为 0 215, 0.0 2 6 和 0.034, 第二个方程中参 
数的标准误差为 0.151. 波动率方程为 



’ 2.80 _ 


* 0.084 


0.864 -0.020' 


^ ll,t 


(0.58) 

+ 

(0.013) 


一 1 

+ 

(0.021) (0.009) 



m a 22 .t 


1.71 


0.037 0.054 




-0.058 0.914 


^22, t-l 


(0.40) 


(0.009) (0.010) 


(0.014) (0.013) 



(10.27) 

如前.小括号内的数值为标准 误差. 条件相关系数方程为 


_ _ ex P ( g <) 

'l + exp( 9t ) 


qt= 2.024 + 3_983 內 — ！十 0.088- ° l,t ~ lQ2 t ~ 1 , 

1-1^22,1 -I 


(10.28) 
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估计的标准误差分别为 0.050, 0.09(1 和 0.019. 上述相关系数方程的参数是高度显 
著的.对标准化残差 a t 应用 Ljung-Box 统计量，有 CM 4) = 20.57(0.11), CM 8) = 
36.08(0.21). 对残差序列的平方，有 QV 4 ) = 16.69(0.27), 弘⑻ = 36.71(0.19). 因此， 
模型的标准化残差没有显著的序列相关性或条件异方差性 

将这个时变相关系数的 GARCH(1,1) 模型与 (10.25) 式中的常相关系数的 
GARCn(l ， l) 模型进行比较很 有趣. 第一，两个模型的均值方程和波动率方程都接 
近.第二，图 10-10 给出了基于模型 （10.28) 对 IBM 股票和 S & P 500 指数的月对数收 
益率所拟合的条件相关系数的时间图.此图表明该相关系数随时间波动，而且近几 
年变得更小.后一个特征与图10- 9 的结论 •致. 笫二，对相关系数拟合的平均值为 
0.612,这与 (10.25) 式中常相关模型的估计 0.614 基本相同.第四，利用 m 的样本方 
差作为条件方差的初始值.观测值从 t = 4 到 t = 888 .则对常相关 GARCH(1 ， 1) 模 
型,其对数似然凼数的最大值为 -3 691.21; 对时变相关 GARCH(1,1) 模型,其对数 
似然函数的最大值为 -3 679.64. 这表明，与常相关模型相比时变相关模型的确有一 
些显著的改善.第五,考虑两个模型以/» = 888为预测原点的向前1步波动率预测 • 


对 (10.25) 式的常相关模型，我们有 ax, 888 = 3.075, a 2t888 = 4.931, <Tn . 888 = 77.91, 
a 22<88 s = 21.19. 因此,对条件协方差矩阵的向前 1 步预测为 


玄娜⑴= 


71.09 21.83 
21.83 17.79 


其中协方差是通过常相关系数 0.614 得到的.对于 (10.27) 式和 (10.28) 式的时变 


相关模型，我们有 a 1|888 = 3.287, 02,888 = 4.950, < r u ,888 = 83.35, ^ 22,888 = 28.56, 
^888 =0.546. 协方差矩阵的向前1步预测为 


亡娜⑴= 


75.15 23.48 
23.48 24.70 


其中相关系数的预测为 0.545. 



图 10-10 为 IBM 股票与 S&P500 指数月对数收益率的条件相关系数拟合例 10.5 中时变相 
关系数 GARCH(1,1) 模型时的时间图.水平线是相关系数的平均值 0.612 





10.4 二元收益率的 GARCH 模型 405 


在第二个方法中.我们利用的 Cholesky 分解来对时变相关件建模.对二元 
情形，参数向量为三= ( ai U , 922^^2!, t y . 参见 （10.18) 式假定服从下述简单 
GARCH (1,1) 类模型 


5 n ,< = am 4- otubi ^! + 

921, t = 70 十 7i92i,e-i 十 72<*2, 卜 1 ， (10.29) 

922, t = «20 + a 2l6? ， t-l + a 22&2.t-l + (h\9l\,t-l + 022922,t-U 

其中， = a 仏 6 2t = tt 2t - q 2 uau . 这样，假定 吣 为一个—兀 GARCH(1,1) 模型, 
b 2t 使用一个二元 GARCH(1,1) 模型，似 1 , 1 是自相关的，并将 a 2 , t -i 作为一个额外 
的解释变量.与 MLE 相关的概率密度函数由 （ 10.20) 式给出，取 fc = 2. 

例 10.5( 续）我们再次使用 IBM 股票和 S & P 500 指数的月对数收益率来说 
明 （10.29) 式的波动率模型.利用与前面同样的指定，我们得到拟合的均值方程 
为 


r\i = 1.364 + 0.075ri^_i 一 0.058r2^— 2 + Qn, T2t — 0.643 + o-2t- 

其中，第一个方程中参数的标准误差分别为0.219, 0.027 和 0.032, 第二个方程中参 
数的标准误差为 0.154. 这两个均值方程都接近于以前得到的结果.拟合的波动率 
模型为 


5u,t = 3.714 -t- + 0.804^1 

® 2i ., = 0.002 9 + 0.991 0.004 (10.30) 

9224 = 1.023 + 0 . 021614 ^ 4 - 0.052&2, t-i — 0.040</ ii , t_i + 0.937^22, t - i > 


其中 = ait ,〜= a 2 t 机 t b u . 方程中参数的标准误差分别为 1.033, 0.022 
和 0.037. 方程 921 .t 中参数的标准误差分别为 0.001, 0.002 和 0.000 4,方程 g 22 , t 
中参数的标准误差分别为 0.344, 0.007, 0.013 和 0.015. 所有的估计都在1%水平下 
显著. 


条件协方差矩阵可以利用 (10.12) 式中的 Cholesky 分解从模型 （10.30) 屮 
得到.对二维情形，这个关系在 (10.13) 式中已经详细给出.因此，我们得到时变相 


关系数为 


021 , t 




V922, t 十 


(10.31) 


利用和的拟合值，我们可以计算标准化残差来进行模型检验.模型 
(10.30) 的标准化残差的 Ljuag-Box 统计量为 Q 2 ⑷= 19.77(0.14)， Q 2 (8) = 34.22(0.27). 
对标准化残差的平方，我们有⑷= 15.34(0.36)， Q 5(8) =31.87(0.37). 这样，所拟 
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合的模 m 在描述条件均值和波动率方面是充分的.这个模型反映了该相关性有很 
强的动态依赖.这可从 (10.30) 式的系数 0.991 5看出 • 

图 10-11 给出了 (10.31) 式拟合的时变相关 系数. 它给出了比图 10-1() 更光滑 
的相关模式，并确认了相关系数的递减趋势特别地，所拟合的最近几年的相关系 
数要小于其他模型的拟合值.对 IBM 股票和 S & P 500 指数的月对数收益率的两个 
时 交相关 模型具有相当的最大似然函数值，大约为- 3 672 ,这表明拟合是相似的 
然而，基于 Cholesky 分解的方法可能有一些 优点. 首先，它并不要求为了保证 K 
的正定性而在估汁中做任何参数限制.如果也利用了 的对数变换，则对整个的 

波动率模型都不需要限制.其次，在变换下，对数似然函数变得很简单.最后，时变 
参数叫，< 和有良好的 解释. 然而，该变换使得推断有点复杂，因为拟合的模型 
可能依赖于屮元素的 次序. 请记住，没有 变换. 理论上，叫中元素的次序应 
该小会对波动半-产生影响 • 



图 10-11 用带 Cholesky 分解的时变相关系数 GARCH (1,1) 模型拟合的 IBM 股票与 
S & P 500 指数的月对数收益率的条件相关系数.水平线是相关系数的平均值 
0.612 


最后，对于新的时变相关模型，以 * - 888为预测原点，条件协方差矩阵的向前 


1步预测 


它888⑴ 


73.45 7.34 

7.34 17.87 


由此得到的相关系数的预测为 0.203. 该值远远小于前两个模型给出的结果.然而， 
条件方差的预测与前面类似. 


10.4.3 最近的一些发展 

对于 Pt ，利用 (10.7) 式中的参数化,有些作者提议利用参数个数更为节约的模 
型来描述时变的相关系数.下面讨论在该方面的两个发展- 
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对于维收益率 • Tse 和 Tsui (2002) 假定条件相关矩阵服从模型 

/> t = (1 — $1 —02)p-\- 0lP t _y 4- 0 2 lf} t _ u 

其 中仏和 是尺度参数， P 是具有单位对角元素的 kx k 正定矩阵，且私 q 是 
kxk 样本相关矩阵.它是利用时间点 f - m ， …，*-1上的扰动计算的，其中 m 是 
事先指 定的. 要求对两个尺度参数仏和的估计作特殊的限制以保证相关矩阵 
的正 定性. 这是一个参数非常节约的模型.然而该模型在实际中很难应用. p 和 m 
的选择需要进行仔细的研究. 

Engle (20 U 2) 提出了如下 模型： 

Pt = J tQtJ“ 

其中， Q , = — k 是正定矩阵，= diagfgr ^ 2 ，... ，‘力，且 Q , 满足 

Qt = (1 -沒1 - 02 )Q + 0 ie t - iei_i + ^hQt 一 u 

上式中是标准化的新息向量•其第 * 个分 董为〜 = a u / v ^ J , 且 Q 是 £< 的无 
条件协方差矩阵 ，^和 是满足0 < 仏 | 心< 1的非负刻度参数 • 是用来标准 
化的矩阵以 保证风 是相关矩阵. 

上述两个模型有一个明显的缺陷，即力 和^ 是刻度，因此所有的条件相关系 
数具有相同的动态性.在实际应用中.很难去判断这是否合理，尤其是当维数 A ■较 
大时. 


10.5 更高维的波动率模型 

在本节中，利用 Cholesky 分解的序贯性，我们提岀一个构造更髙维波动率模型 
的 策略. 再次将向量收益序列写为 r t = H t + a t . 可以利用第8章的方法为 r < 指定 
一个均值 方程. 通常简单的向量 AR 模型就足 够了. 这里我们集中讨论利用扰动过 
程中建立波动率模型. 

根据 HU 节对 Cholesky 分解的讨论，从到的正交变换只涉及了 < 

i ). 男外，的模型只依赖于与< i ) 相关 的量. 从这种意义上讲，1 0 . 4 节建 
立的时变波动率模型是嵌套的.因此,我们考虑按照下面的一系列程序来建立多元 
波动率模型. 

(1) 选择一个最感兴趣的市场指数或股票收 益率. 对选择的收益率序列建立一 
个一元波动率模型. 

」 2 )将第二个收益率序列扩充到系统中，将扩充后的新收益率序列的扰动过程 
进行正交变换，并对系统建立一个二元波动率模型•第〗步中一元模型的参数估计 
可以作为二维估计的初始值 
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年 

( c ) Intel 公司 



图 10-12 S & P 500 指数 （( a ))、 Cisco 系统股票 （( b )) 和 Intel 公司的股票 （( c )) 的闩对数收 

益率（百分比形式）的时间图，时间区间是从1991年1月2日到1999年12月31日 

利用 Ljung - Box 统计量来识别收益率序列之间的序列相关性，得到 A ⑴= 
26.20. QU 4) = 79.73, Q 3 (8) = 123.68. 这些检验统计量都是高度显著的，分别与自 
由度为9, 36和72的 x 2 分布比较，其 P 值都接近于 0. 数据中确实存在某些序列相 


(3) 将第三个收益率序列扩充到系统中，对新增加的扰动过程进行正交变换，并 
建立一个兰元波动率模型.二元模型的参数估计作为三维估计的初始值- 

(4) 继续此扩充直到对所有感兴趣的收益率序列建立了联合波动率模型 
最后.在每一步中进行模型检验以保证所拟合模型的充 分性. 经验表明这一系 

列程序可以实质性地简化建立高维波动率模型的复杂性.特别是可以大大减少估计 
的计算时间. 

例 10.6 我们通过对 S & P 500 指数、 Cisco 系统股栗和 Intel 公司股票的曰对数 
收益率 建立一 个波动率模型来说明上面所提山的 系 列程序 • 数据的时间区间是从 
1991年1月2日至1999年12月 3 1 日，共 2 275 个观测值.对数收益率以百分 
比表示.图 10 - 12 给出了其时间图_收益率序列的分量排序为 n = ( SP 5 t , csco t . 
INTCt /. 数据的样本均值、样本标准差和样本相关矩阵为 

0.066 1 [^1 *1 0.875 1.00 0.52 0.50 

ft , — 0.257 ， ( f'l — 2.853 , P = 0.52 1 .00 0.47 

0.156 0- 3 2.464 0.50 0.47 1.00 
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关性.表 10-1 给出了以第 S 章中的简单记号表示的样本交叉相关矩阵的前 5 个延 
迟. 检査此表可见⑷ S & p .^ on 指数的日对数收益苹并不依赖子 Cisco 或 Intel 过 i 
的收 益率； （ h ) Cisco 股票的对数收益率貝有某些序列相关性，并且依赖于 S & P 500 
指数的过去收益率（见延迟 2 和 5 ); ( c ) Intel 股票的对数收益率依赖丁- S & P 500 指 
数的过去收益宇（见延迟1和 5). 这些观测类似于第8章中分析的 IBM 股票和 
S & PS00 指数收益率之间的结果.它们表明具有较大资本的单个公司的收益率倾问 
于受市场过去行为的影响.然而，市场收益率并不会受到单个公司过去收益率的显 
著影响. 

表 10-1 S & P 500 指数， Cisco 系统股票和 Intel 公司的股票的日对数收益率的样本交叉相 

_关矩降.时间区间是从1991年1月2日到1999年12月31日 

间 隔 

- 1 1 2 3 r 4 n I I 6 


进而考虑波动率模型、按照所建议的 步骤. 我们从 S & P 500 指数的对数收益率 
开始，得到模型 

rii =0.078+0.042 r lit _ l -0.062 r l . t _ 3 -0.048 r 1 ,,_4-0.052 r 1( ^ s - l - ai t , 

^ n,t =0.013 + 0.092 a ? >t _, + 0.894^1,,,,, (10 . 32 ) 

均值方程中参数的标准误差分别为 0.01( i ， () . () 23, 0.020, 0.022 和 0.020; 波动率方程 
中参数的标准误差分别为 U . UU 2 ,0.006 和 0.007. 一元模型的标准化残差及标准化 
残差平方序列的 Ljung - Box 统计量没有识别出数据中任何余留的序列相关性或条 
件异方差性.事实上，对标准化残差，我们有 Q (10) = 7.38(0.69), 而对其平方序列 
W 0) = 3.14(0.98). 

将 Cisco 股票的日对数收益率扩充到系统中，我们建立一个二元模型具有的 
均值方程为 

^lt =0.065 - 0,046ri,(—3 + 

r 2t =0.325 + 0.195 r lit _ 2 - 0.091 r 2 , t _ 2 + a 2 f (1 °* 33) 

其中所有的估计在1%的水平下都是统计显著的•利用 Cholesky 分解的记号我们 
得到波动率方程为 

<7 ii , t = 0.006 + 0.0516^_, +0.943^ i M _ 1 , 

92 1 , t = 0.331 + 0. 790^21, t-i - 0.041 a 2 ,<_ i , (10.34) 

922, t = 0.177 + 0.082 岐 t-1 + 0.890«722. t - i , 

其中 = an , 6^ = — 92 i , tbu - ffn . t 方程中参数的标准误差分别为 0.001,0.005 

和 0.006; gal , t 方程中参数的标准误差分别为 0.156,0.099 和 O.m 1 : g 22<t 方程中参数 
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的标准误差分别为 0.029,0.008 和 0.011. 标准化残差的二元 Ljung - Box 统计量没有 
识別出住何余留的序列相关性与条件异方差性，从而二元模型是充 分的与 00.32) 
式比较，我们看出的边际模型和一元模型之间的差别很小 • 

下一步（也是最后步）是将 Intel 股票的日对数收益率扩充到系 统中. 均值 
方程变为 

rit = 0.065 — 0.043rij—3 + 

r 2 t= 0.326 + 0.201ri,t — 2 — 0.089r2,e —2 ^ ° 2 £? (10.35) 

r 3 t-= 0.192 - 0.264r ltt -a f 0.059r 3> t-x + a 3i . 

第一个方程中参数的标准误差分别为 0.016 和 0.017; 第一个方程中参数的标准误 
差分别为0.052, (1.059 和0,021;第三个方程中参数的标准误差分别为 0.050,0.057 
和 0.022. 大约1%的水平下所有的估计在都是统计显著的.如所料想， nt 和的 
均值方程与二维情形中的基本相同 • 

三维时变波动率模型变得更加复杂,但仍然很容易处理，因为 

<7u,i=0 ° 06 + 0.050 的 , f _i 十 0.943fm,t-i, 
q2i % t = 0.277 十 0.824qf2M -1 — 0.035a2,t-ii 

ff22.t= IU78 + 0.082 的 ，卜 1 十 0.889 仍 2,f •一 I ， （ 10.36) 

= 0.039 4- 0.973 助 1 』一 1 + 0.010a3,t—ii 
^32,t = 0.006 + 0,981 分 32.t-i + 0.U04a2 t t-i, 
fl33，t = 1.188 +0.0536*3 ft _i + 0.687p33,t-i 一 0.019p22,t-ii 

其中 fc lt = aUl &2 t — a 以一 q 2 i 1 tbu 1 b 3i = a 3 t - qsi , tb\t — 932 ，如 •表 10-2 给出了参 
数的标准误差.除了 932』方程中的常数项，所有的估计在5%的水平下都是显著的 • 
令 d t — ( a lt / a n , «2 t , a 3I /& 3 t )' 为标准化的残差序列，其中是对第 
i 个收益率拟合的条件标准差 • 4的 Ljung Box 统计量给出 Q 3 (4) = 34.48(0.31), 
g 3 ⑻二60.42(0.70)，其中/分布的自由度分别为31和67,该自由度是将均值方 
程屮使用的参数数量调整之后得 到的. 对 T 残差序列的平方我们有 QS (4) = 
28.71(0.58), 沾⑻= 52.00(0.91), 因此，在给条件均值和波动率建模时所拟合的模 
型是充分的. 


表 10-2 给 S & P 600 指数. Cisco 系统股票和 Intel 公司股票的 R 对数收益率（百分比形 
式〉拟合的三元波动率横型的参数《估计值的标准差，时间区间是从1991年1 
月2日到1999年12月31日 a 
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图 10-13 给从 1991 年 1 月 2 日到 1999 年 12 月 31 日， （ a) S&P500 指数； （ b) Cisco 系统和 : 
(c) Intel 公司的股票的曰对数收益率（百分比形式）拟合的波动率的时间围 

(10.3 6 ) 式中的波动率模型包含两套方程.第一套方程描述了条件方差的时间 
演变（即 9 ii , t ), 第二套方程处理相关系数（即叫 , t , i > j). 对这个特殊的数据集 
合，一个 AR (1) 模型对相关系数方程可能就足够了.类似地，一个简单的 AR 模 
型对条件方差也可能是足够的.定义’ = ( Vll , t ， V22 ，⑽， 其中心 = 

W = (<721, t , g 31,^732, t )'- 前面的讨论启示我们可以利用简单的1步延迟模型 


方程 (10.36) 中的三元波动率模型有一些有趣的特征第 一 ，它本质上是一个 
时变相关的 GARCH(l.l) 植型，闵为方程中只用到了 1步延迟变量.笫二, S & P 500 
指数日对数收益率的波动率不依赖于 Cisco 或 Intel 股票收益率过去的波动率.笫 
三，通过取 CholPsky 分解的逆变换， Cisco 和 Intel 股票日对数收益率的波动率依 
赖于市场收益率过去的波动率.参见10 . 3 节给出的心和的元素之间的关 
系.第四，描述相关的量叫. t 有很高的持续性，并具有很大的 AR (1) 系数. 

图 1( M 3 给出了数据拟合模型的波动率过程（即为 i|t ). 指数收益率的波动率远 
远小于两个单只股票收益率的波动率.图形也表明了指数收益率的波动率近年来已 
经增加，但是 Cisco 系统股票的收益率却并非如此.图 UM4 给出三种收益率序 
列之间的时变相关系数.比较图 10-13 与图 1(M4 可得到有意思的结论.这些结论 
表明当收益率波 动时. 两个收益率序列之间的相关系数是递 增的. 这与国际股票市 
场指数间关系的实址研究结果是一致的，两个市场之间的相关性在金融危机期间倾 
向于递增. 


(a) 



1992 1994 1996 i 998 2000 

年 



504 () 3 () 2(}10 

#吞堪 
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10.6 因子波动率模型 

简化多元波动率过程动态结构的另一种方法是利用囚子模型.实际中，“公共 
因子”可以通过固有性质或经验方法预先 设定. 作为说明，我们利用笫 8 章的囚子 
分析来讨论因子波动率 模型. 因为波动率模型关心的是叫的条件方差矩阵随时间 
的演变，其中所以波动率中识别“公共因于”的一个简单方式是对山 
进行主成分分析 ( PCA ). 具体可参见第8韋中的 PCA . 这样，建立一个因子波动率 
模型涉及一个三步的 程序： 


秋（V 
毋0, 


1992 


1994 


1996 


1998 


2(X)0 


图 UM4 给 S&P500 指数、 Cisco 系统股票和 Intel 公司股票的日对数收益率拟合的时变相 
关系数的时间图，时间区间是从1991年1月2日到1999年12月31日 


Vf = Cl q f = C2 + 0 7 q t _x 

作为对资产收益率波动率建模的精确函数，其中 Ci 是常向量.汍是 3 X 3 实值矩 
阵.如果前一方程中再加上噪声项，则模型变为 

vt = ci + ^iV t -i -f e u , q, =c 2 + + e 2 t ， 

其中是均值为 0 的随机扰动，具有正定协方差 矩阵. 并且我们有一个简单的多 
元随机波动率 模型. 在一个最近的手稿中， Chib, Nardari 和 Shpphard(1999) 利用 
MCMC 方法来研究高维的随机波动率模型.那里考虑的模型以一种带限制的方式 
允许时变的相关性.多元波动率模型的其他参考文献包括 Harvey, Ruiz 和 Shephard 
(1995). 在笫 12 章中，我们将讨论波动率建模的 MCMC 方法. 


(a) S^P biK) 指数与 Cteco 系统 



年 

(c) Ci>ro 系统 Ljlutd 公司 
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• 选择前几个主成分，使得它们所能解释的的变化占很高的百 分比； 

• 对选择的主成分建立一个波动率 模型； 

• 将每个序列的波动率与所选主成分的波动率联系起来. 

这个程序的目的是降低维数，但要保持多元波动率较精确的近似. 

例 10.7 再次考虑例 10.5 中的 IBM 股票和 S&P500 指数以百分比表示的月对数 
收 益率. 利用例 8.4 中的二元 AR(3) 模型.我们得到新息序列根据~的协方差 
矩阵对 a, 进行主成分分析，我们得到特征值63 373和 13.489. 第一个特征值解释了 
的广义方差的82.2%.因此,我们可以选择第一个主 成分: r t = 0.797a lt -f0.604a 2t 
作为公共 因子. 另外一种选择，正如例 8.4 中的模型表明的，巧的序列相关性很弱， 
从而可以直接对 r t 进行主成分 分析. 对这个特例， r, 的样本协方差矩阵的两个特 
征值是 63 . 625 和 13.513, 这与基于的结果基本相同.第个主成分近似解释了 
r t 的广义方差的82.5%,对应的公共因子是別= 0.796r u + 0.605r 2t . 因此，对所考 
虑的两个月对数收益率序列，条件均值方程对 PCA 的影响是可以忽略的. 

根据前面的 i、j 论，并且为了简便，对这两个月对数收益率序列，我们使用力= 
0.7 9 6r lt +D.6U 5 r 2t 作为一个公共因子.图 l(M5a 给出/这个公共因子的时间图. 
如果使用一元高斯 GARCH 模型，则对:我们得到下面的 模型： 


Xt = 1.317 + O.OOGart-! + o t , a t — < r t e t , 
of - 3.834 + O.llOa^! + 


(10.37) 


此模型的所有参数估计在1%的水平下都是高度显著的，而且标准化的残差及其平 
方序列的 Ljung-Box 统计量没有识别出模型的不充分性.图 l(M5b 给出了 的 
拟合波动率（即 (10.37) 式中的样本疗序列). 


图 10-15 


⑷第上成分 



GARCH(1, 1) 模型所拟合的波动率过程 
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利用模型 (10.37) 中的疗作为一个共同波动率因子，对于原始的月对数收益 
率,我们得到下面的模型.均值方程为 


r\t = 1.140 十 0.079 ri , t — 1 + 0.067 ri , t —2 — 0.122 r *2， t— 2 + flit ? 
V 2 t — 0.537 + ci 2 t > 


第一个方程中参数的标准误差分别是 0,211,0.030,0.031 和 0.043 ,第二个方程中参 
数的标准误差是 0.165. 条件方差方程为 


1 

.19.08 . 


■ 0.098 





(3.70) 

4- 

(0.044) 



+ 

^ 22 , t 


一 5-62 

丁 





1 

(2.36) 



1 



0.333 

(0.076) 

0.596 

(0.050) 


erf , (10.38) 


如前一样，小括号内的数值是标准差， W 是从模型 (1 U -37) 得 到的. 条件相关系数 
方程为 


= exp(qt) 

— l+exp(g t ) 


g t = —2.098 + 4.120 p*_ l 4- 0.078 




(10.39) 


三个参数的标准误差分别是 0.025,0.038 和 0.015. 如前一样定义标准化的残差序 
列，得到 Q 2 ⑷=15.37(0.29)， Q 2 (8) = 34.24(0.23), 其中，小括号内的数值表示 p 
值.因此，标准化的残差没有序列相关性.对其平方序列，有切⑷= 20.25(0.09), 
仍⑻= 61.95(0.000 4). 这说明 (10.38) 式的波动率模型不能充分处理数据的条件 
异方差性，尤其是在更高延迟时.这并不奇怪.因为单个公共因子仅仅解释了数据 
广义方差的大约82.5%. 

比较 (10.38) 式和 (10 39) 式中的因子模型与 （10.27) 式和 （10.28) 式中的时变 
相关模型，我们看出 （ a ) 两个模型的相关方程基本 相同； （ b ) 如所料想，在波动率方 
程中，因子模型利用了较少的 参数； （ c ) 公共因子模型提供了数据波动率过程的一 
个合理的近似. 

注释： 例 10.7 中，我们利用了一个两步估计程序.第一步中，对公共因予建 
立了一个波动率 模型. 第二步中把波动率的估计当作己给定来估计多元波动牟模 
型.这样的估计程序很简单，但可能并不 有效. 更加有政的估计程序是进行联合 
估计.这种操作在公共因于已知的条件下相对比较容易.例如，对例 10.7 中的月 
对数收益率，如采认为公共四子叫= 0.769 r lt +0.605 r 2< 是给定的，則可以对方程 
(10.7) - (10-39) 进行联合 估计. 口 
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我们通过考虑多种资产的一个金融 头十的 VaR 来说明多兀波动率模型的应用. 
假定投资者持有价值为 1 UU 万美元的 Cisco 系统股票和 Intel 公司股票的一个长期 




10.7 应 用 415 


头寸.我们利用两只股票从1991年1月2曰至1999年12月31日的日对数收益 
率建立波动率模型.在数据期间的最后，利用向前1步预测和5%的临界值来计算 
VaR . 

令 VaRi 表示持有 Cisw ) 系统股票头寸的 VaR , 并令 VaR 2 表示持有 Intel 股 
票头寸的 VaR . 第7章中的结果证明了投资者总的日 VaR 为 

VaR = VaR ? 4- VaR ^ + 2 pVaRiVaR 2 . 

在这个解释中，我们考虑计算 VaR 的波动率模型的二种方法.为了简便.我们没有 
对涉及的参数或模型检验统计量报告其标准误差.所有的参数估计在5%的水平下 
都是统计显著的，而且根据标准化的残差序列及其平方序列的 Ljuug Box 统计量可 
知该模型是充分的.对数收益以百分比表示，以致 VnR 计算中的分位数除了 10(). 
令 r u 表示 Cisco 系统股票的收益率， r 2 < 表示 Intel 股票的收益率. 

一元模型 

此方法对每只股票收益率都使用一元波动率模型，并用股票收益率的样本相关 
系数估计 P . 两只股票收益率的一元波动率模型为 

^it = 0.380 ) 0.034r*i,f,_i 0.061ri,t — 2 — 0.055ri ,<— 3 + a H ， 

<7^=0.599 + 0.117 af . 卜 j 十 0.814 a ^ t _ 1? 

T 2 t = 0.187 -(- 02 t , 

(7 & =0.310 十0.0320| ,_! + 0.918(7| (t _ 1 . 

样本相关系数为 0.473. VaR 计算中需要以 i = 2 275为预测原点的向前1步预测 
为 

6 = 0.626，衿= 4.152，6 = 0.187，与= 6.087 ， p = 0.473. 

两个日收益率的5%分位数为 

Q \ = 0.626 - 1.65\/4.152 = -2.736, g 2 = 0.187 - 1.65>/^087= -3.884. 
其中负号表示损失.单只股票的 VaR 为 

VaRx = $1 000 000 gi /100 = $27 360, VaR 2 = $1 000 UU 0 g 2 /100 = $38 840. 

因此，投资者总的 VaR 为 VaR = $57 117. 

常 相关二元樓型 

此方法对股票收益率釆用一个二元 GARCH (1，1) 模型.假定相关系数随时间 
固定不变，但它可以与其他参数联合估计.模型为 

ru = 0.385 + 0.038 ri , t— 1 - 0.060 ri , t— 2 - 0.047 ri . t— 3 + flu ， 

T2t = 0.222 十 02ti 

= 0.624 + O . llOaf ^! + 0.816 am — i ， 
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<r22,t =0.664 十 0.038(2^4 + 0.853<722,t-i, 
p=0.475. 

这是一个对角的二元 GARCH ( U ) 模型 . VaR 计算中在预测点 t = 2 275的1步向 
前预测为 


fi = 0.373, cr{ = 4.287, r 2 = 0.222, cr\ = 5.706, p = 0.475. 

因此，我们有 

VaR, = $30 432, VaR 2 = $37 195. 

投资者总的5%的 VaR 为 VaR = $58 180. 

时变相关模型 

最后，通过 Cholesky 分解我们允许相关系数随时间变化.拟合的模型为 
T\t =0.355 十 0.039n , 卜 1 一 0.057ri ， 卜 2 — 0.038n, 卜 3 十 a it ， 

T2t = 0.206 十 a2ty 

9u,t = ().420 + 0.1)916? ^! 4- 0.858 5 n,i-i, 

92 i,t = 0.123 + 0.689<72 i , t-i — 0.014 a 2, t - i , 

522 ,t = 0.080 + 0.013&2,4-1 + 0.971^22, i - l » 

其中 6 lt = = «；» - q ^ tau - VaR 计算所需的在预测点 < = 2 275 处的 1 步 

向前预测为 


fy = 0.352, f 2 = 0.206, = 4.252, 921 = 0.421, g 22 = 5.594. 

因此,我们有疗= 4.252, &21 = 1.791，的= 6.348. 相关系数为 p = 0.345. 利用这些 
预测，我们有 VaRi - $30 504, VaR 2 - $39 512. 总风险值 VaR - $57 648. 

三个方法的 VaR 估计是类似的. 元 模型给山了最低的 VaR , 而常相关模型 
产生了最高的 VaR . 差别大约为1 100美兀.时变波动率模型是两个极端模型的中 
和. 


10.8 多元 t 分布 


实证分析表明，前一节屮使用的多元髙斯新息可能不能刻画资产收益率的峰 
度.在这种情形下，多元学生分办可能是有用的.存在许多形式的多元学生 
分布.这里对波动率的建模,我们给出一个简单的形式. 

称 k 维随机向童 x = ( x lr -- , x k y 服从自由度为参数为 p = 0, s = /(单 
位矩阵）的多元学生 t - 分布，如果其概率密度函数 （ pdf ) 为 


/(*!«)- 


r ((斜 fc )/2) 

(m;) fc / 2 r>/2) 


(1 




(10.40) 
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其中 r ( y ) 是伽马 函数. 参见 Mardia , Kent 和 Bibby (1979, p 57). (10.40) 式的每个 
分量而的方差为 !；/(!；- 2)，从而定义 q = s /( v -2)/ vx 为自由度为 r 的标准化的 
多元学生分布.通过变换, e , 的概率分布密度函数是 


/( _) = 作- 2)— 也]_(，/ 2 . (10-41) 

对波动率模型，记= E ； /2 e t , 并假定服从 (10.40) 式中的多元学生 t -分布. 


通过变换 . 的概 率密度函数是 

/( a t | r ;, S t )= [咖 1 1 + • 

而且，如果我们利用 S t 的 Cholesky 分解，则变换后的扰动 6 t 的概率分布密度函 


数变为 


f{b t \v } L t ,G t ) = 


T((v + k)/2) 

Hv-2)\^nv/2)X\U^ 2 t 


1 + (v - 2) _l 


y 3 l 

Ojj,t 


~(«+*)/2 


其中 = L t b ugji ， t 凫 bji 的条件方差.因为这个概率密度函数并不包含任何矩阵 
的逆,所以很容易计算数据的条件似然函数. 


附录对估计的一些注释 

本章中多元 ARMA 模型的估计是利用“科学计算帮手”中的时间序列程序 
SCA 进 行的. 多元波动率模型的估计可以利用 S - plus 中的 FinMetrics 或时间序列 
的回归分析 ( RATS ) 程序进行.下面是利用 RATS 程序估计多元波动率模型的一 
些运行流程.以“ *” 开始的行表示“注解 

例 10 . 5 中的对角常相关 AR ( 2 )- GARCII ( 1 , 1 ) 模型的估计 

该程序包括对每一个分量的一些 Ljung - Box 统计量以及最后几个观测的一些 
拟合值.数据文件为 m - ibmspln . dat , 有两列共888个观测. 
all 0 888:1 

open data m-ibrnspln. txt 
data(org=obs) / rl r2 



nonlin aO al bl aOO all bll rho cl c2 pi 
frral alt « rl(t)-cl-pl*r2(t-l) 
frml a2t = r2(t)-c2 

trm 丄 gvarl = a0+al*alt (t-1) **2-fbl*hl (t-1) 
frml gvar2 = a00+all*a2t(t-1}**2+bll*h2(t-l> 
frml gdet =* -0.5* (log (hi (t) =gvarl (t) )-i*log(h2 (t)=gvar2 (t)) $ 
♦log(l-0-rho**2)) 
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set residsq * resi2(t)*resi2(t) 

* Checking standardized residuals * 
cor(qstats,number=12,span=4) resi2 

* Checking squared standardized residuals 


idsq 





888 shock1 shock2 fvl fv2 


中的时变相关系数模型的估计 


































附录对估计的一些注释 419 


compute aO = 2.95, al = 0.08, bl = 0.87, fl = -.03 
compute aOO = 2.05 t all * 0.05 

compute bll = 0.f11=-. 06, dll=.04, qO « -2.0 

compute ql = 3.0, q2 = 0.1 

nlpar(criterion=value,cvcrit=0•00001) 

maximize(method=bhhh # recursive,iterations=150) gin 

set fvl = gvarl(t) 

set resil « alt(t)/sqrt(fvl(t)) 

set residsq = resil(t)*resil(t) 

* Checking standardized residuals * 
cor(qstats # number=1Rpan=4) resil 

* Checking squared standardized residuals * 
cor(qstats,number=16 # span=4) residsq 

set fv2 » gvar2(t) 

real2 = a2t (t) /sqrt (fv2 (t)) 
set residsq = resi2(t)*resi2(t) 

* Checking standardized residuals * 
cor(qstats,number=16 # span=4) resi2 

* Checking squared standardized residuals ♦ 
cor(qstats,number=16,span=4} residsq 

* Last few observations needed for computing forecasts * 
set rhohat = rho(t) 

set shockl » alt(t) 
set shock2 « a2t(t) 

print 885 888 shockl shock2 fvl fv2 rhohat 


利用 Cholesky 分解进行例 10.5 中的时变相关系数模型的估计 

all 0 888:1 

open data m-ibmspln.txt 
data(org^obs) / rl r2 
set hi = 45.0 
set h2 = 20.0 
set q = 0.8 

nonlin aO al bl aOO all bll dll fll cl c2 pi p3 to tl t2 
frml alt = rl(t)-cl-pl*rl(t-l)-p3*r2(t-2) 
frml a2t = r2(t)-c2 

frml vl = aO+al*alt(t-l)**2+bl*hl(t-l) 
frml qt = to + tl*q(t-l) + t2*a2t(t-l) 
frml bt = a2t(t) - (q(t)=qt(t))*alt(t) 
frml v2 = a00+all*bt(t-l)**2+bll*h2(t-l)+fll*hl(t-l) $ 
+dll*alt(t-l)**2 

frml gdet = -0.5* (log (hi (t) = vl (t) ) + lcjg (h2 (t) =v2 (t ))) 
frml garchln = gdet-0.5*(alt(t)**2/hl(t)+bt(t> **2/h2(t)) 
smpl 5 888 

compute cl = 1.4, c2 = 0.7, pi = o.l, p3 = -0.1 
compute aO = 1.0, al = 0.08, bl = 0.87 
compute aOO = 2.0. all = 0.05, bll = O.fi 
compute dll=.04, fll»-.06, t0 =0.2, tl = 0.1, t2 = 0.1 
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nlpar(criterion=value,cvcrit=0.00001) 

maximize(method=bhhh,recursive,iterations=150) garch 丄 n 
set fvl = vl(t) 

set r«si1 = alt(t)/sqrt(fvl(t)) 
set residsq = resil(t)*resil(t) 

* Checking standardized residuals * 
cor (qstats, number=16, speui=4) resil 

* Checking squared standardized residuals ♦ 
cor(qstats,number=16,span=4) residsq 

set fv2 » v2(t)+qt(t)**2*vl(t) 
set resi2 = a2t(t)/sqrt(fv2(C)) 
set residsq = resi2(t}*resi2(t) 

* Checking standardized residuals * 
cor(qstats,number=16,span=4) resi2 

* Checking squared standardized residuals * 
cor(qstats,number=16,span-4) residsq 

* Last few observations needed for forecasts * 
set rhohat = qt(t)*sqrt(vl(t)/fv2(t)) 

set shockl = alt(t) 
set shock2 车 a2t(t) 
set g22 - v2(t) 
set q21 * qt(t) 
set b2t = bt(t) 

print 885 888 shockl shock2 fvl fv2 rhohat g22 q2l b2t 

利用 Cholesky 分解进行例 10.6 中的三元时变相关系数波动率模型的估计 

初始的估计值是由序员建模方法给出. 

all 0 2275:1 

open data d-cscointc.txt 

data(org-obs) / rl r2-r3 

set hi = 1.0 

set h2 = 4.0 

set h3 = 3.0 

set q21 = 0.8 

set g31 * 0.3 

set q32 = 0.3 

nonlin cl c2 c3 p3 p21 p22 p3l p33 aO al a2 to cl t2 bO bl $ 
b2 uO ul u2 wO wl w2 do dl d2 d5 
frml alt = rl(t)-cl-p3*rl(t-3) 
frml a2t = r2(t)-c2-p21*rl(t-2)-p22*r2(t-2) 
frml a3t - r3(t)-c3-p3l*rl(t-1)-p33*r3 (t-1) 
frml vl = aO+al*alt(t-1)**2+a2*hl(t-1) 
frml qlt = to + tl*q21(t-1) + t2*a2t(t-1) 
frml bt = a2t(t) - (q21(t)=qlt(t))*alt(t) 
frml v2 = bO+bl*bt(t-1)**2+b2*h2(t-1) 
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frml q2t = uO + ul*q31(t-l) + u2*a3t(t-1) 
firml q3t = WO + Wl*q32(t-1) + W2*a2t 《 t-1) 

frml bit = a3t(t)-(q31(t)-q2t(t))*alt(t)-(q32(t)=q3t(t))*bt(t) 

frml v3 xx dO+dl*blt (t-1) **2+d2*h3 (t-1) +d5*h2 (t-1) 

frml gdet = -0.5* (log(hi(t) = vl(t)) + log(h2(t)=v2(t)) $ 

+log(h3(t)=v3(t))) 

frml garchln = gdet-0.S*(alt(t)**2/hl(t)+bt(t)**2/h2(t) $ 

♦bit(t)**2/h3(t)) 

smpl 8 2275 


compute 

cl 

« 0.07 

c2 = 0 

• 33 

c3 * 0.13, pi » 0.1, p3 

compute 

P21 

*0.2, 

p22 sc - 

0.1 

p31 » -0.26, p33 = 0.06 

compute 

a0 

=.01, 

al = 0. 

05, 

a2 = 0.94 

compute 

to 

= 0.28 

tl =0. 

82 # 

t2 = -0.035 

compute 

b0 

» .17, 

bl - 0. 

06 # 

b2 = 0.89 

compute 

uO* 

0.04 # 

Ul = 0. 

91, 

u2 = 0.01 

compute 

wO 

=0.006 , wl=0. 

98, 

w2=0.004 

compute 

dO 

= 1.38, 

dl = 0. 

06, 

d2 = 0.64, d5 = -0.027 


nlpar(criterion=value,cvcrit=0. 00001 ) 

maximize(method=bhhh,recursive,iterations=250) garchln 


set fvl = vl(t) 

set resil = alt(t)/sqrt(fvl(t)) 
set residsq = resil(t)*reoil(t) 

* Checking standardized residuals * 
cor(qstats,number=12,span=4) resil 

* Checking squared standardized residuals * 
cor (qst ： ats,number=12, span-4} residsq 

set fv2 = v2 (t) +qlt (t) **2*vl (t) 
set resi2 ® a2t(t)/sqrt(fv2(t)) 
set residsq = resi2(t)*resi2(t) 

* Checking standardized residuals * 


cor(qstats,nuraber=12,span=4) resi2 

* Checking squared standardized residuals * 

cor(qstats,nuraber=12,span=4) residsq 

set fv3 = v3 (t) +q2t (t) **2*vl (t) -*-q3t (t) **2*v2 (t) 

set resi3 = a3t(t)/sqrt(fv3(t)) 

set residsq = resi3(t)*resi3(t) 


-0.04 


* Checking standardized residuals * 
cor(qstats,number=12,span=4> resi3 

* Checking squared standardized residuals * 
cor (qstats, nutnber=12, span=4) residsq 

* print Standardized residuals and correlation-coefficients 
set rho21 = qlt(t)*Rqrt(vl(t)/fv2(t)) 

set rho31 = q2t(t)*sqrt(vl(t)/fv3(t)) 
set rho32 = (q2t(t)*qlt(t)*vl(t) $ 

-t-q3t (t) *v2 (t) ) /sqrt (fv2 (L) *fv3 (t)) 
print 10 2275 resil resi2 resi3 

print 10 2275 rho21 rho31 rho32 
print 10 2275 fvl fv2 fv3 
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练习题 

10.1 考虑 S & P 综合揩数、 IBM 股票和 Hewlett - Packard ( HPQ ) 股票从1926年1月至2003年 
12月的月对数收益率，共504个观测值.对数收益率数据在文件 m-spibmhpq6203.txt 中. 
对于这三个对数收益率序列，利用指数加权滑动平均方法获得多兀波动率序列 . A 的估计 
值是多少 V 圆出这三个波动率序列的时间图. 

10.2 讨论 03M 股粟和 HPQ 股票从 1920 ^ 1 月至 2003 年 12 月的月对数收益率.为这个二 
元收益串序列 拟合个 DVEC(1, I) 模型.该模型是否充分？画出所拟合的波动率序列和 
时变相关系数的时间图. 

10.3 讨论 S&P 综合指数和 HPQ 股票的月对数收益率，为这个二元序列建立一个 BEKK 模 
型.所拟合的模型是什么？ 出所拟合的波动率序列和时变相关系数的时间图. 

10.4 为 S & P 综合指数、 IBM 股票和 HPQ 股票3个月对数收益率建立一个常相关波动率模 
型.给出所拟合的模型.该模型是否充分？为什么？ 

10.5 文件 B-spibmge.txt 包含了 S & P 500 指数， IBM 股票、通用电气股票从19邪年1月至 
1999年12月的月对数收益率，收益率包括了分红并以百分比表示.讨论通用电气股票和 
S & P 500 指数以百分比表示的月对数收益率.对这个二元序列建立一个常相关 GARCH 模 
型.检验拟合模型的充分性，并得到协方差矩阵以1999年12月为预测原点的向前1步预 
测. 

10.6 讨论以百分比表示的 GE 股票和 S & P 500 指数的月对数收益率.并对这个二元序列建立 
一个时变相关的 GARCH 模型，并对相关系数利用 logistic 凼数. 检验拟合模型的允分性, 
并得到协方差矩阵以 iyyy 年 u 月为预测原点的向前 1 步预测 • 

10.7 讨论以百分比表示的通用电气股栗和 S&P500 指数的月对数收益率.对这个二元序列利用 
Cholesky 分解建立个时变相关的 GARCH 模型.检验拟合模型的充分性，并得到协方 
差矩阵以 1999 年 12 月为预测原点的向前〗步预测.比较所得模型与前面两个问题中所 
得的模型. 

10.8 考虑三维收益率序列.利用 Cholesky 分解给数据建立多元时变相关波动率模型.讨论模 
型的涵义，并计算预测原点为 < = 888的向前1步波动率预测倌. 

10.9 —位投资者想知道他持有50万美元的 Dctl 股票和100万美元 Cisco Systems 股票的多 
头头寸的风险值 （ VaR ). 用从1990年1月20日到1999年12月31日的日对数收益率 
和5%的临界值来计算.数据在文件 d-dellcsco9099.txt. 运用 10.7 节介绍的波动率建模 
的三种方法，并对结果进行比较. 
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第 11 章状态空间模型和卡尔曼滤波 


状态空间模型为时间序列分析提供了一种灵活的方法，尤其是在简化最大似然 
估计和处理缺失值方面.本章将讨论状态空间模型和 ARIMA 模型的关系、卡尔曼 
滤波算法、各种平滑方法及一胜应用.在引进一般的状态空间模型之前，我们先介 
绍一个简单模型.该模型体现了状态空间方法应用于时间序列分析的基本思想•为 
了对这个简单模型作进一步说明，我们用该模型来分析某公司资产收益率的已实现 
波动率序列、时变系数的市场模型以及每只股票的季度收益序列. 

许多书都讨论了如何利用状态空间模型进行统计分析 . Durbin and Koopman 
(2001) 给出了状态空间模型最近的一些处理方法 ； Kim and Nelson (1999) 则集中 
i 、 J " 论了状态空间模型在经济和体制转换中的应用 ； Audersuu aud Moore (1979) 对 
于状态空问模型方法的理论和应用给出了很好的概括（主要是工程和最优控制方 
面).许多时间序列的教科书都包含了状态空间模型和卡尔曼滤波方面的内容，例 
如 ， Chan (2002 )， Shumway and Stotfer (20 UU ), Hamilton (1994) 和 Harvey (1993) 中 
都有章节讨论该 问题 . West and Harrison (1997) 给出了一种贝叶斯处理方法，其重 
点在于预测.而 Kitagawa and Gersch (1996) 则使用/一种平滑的先验方法. 

卡尔曼滤波和平滑算法的推导必然要用到大量的 符号. 因此，若读者只对状态 
空间模型的概念和应用感兴趣，那么相对来说 11.4 节将比较枯燥，故初次阅读时可 
以跳过不读. 


11.1 局部趋势模型 

考虑一元时间序列讲，满足 

yt=#t + et, e t ~ N(0,ag), (ll. 1 ) 

fii+i = Ht +77 t , r]t ~ 7 V (0,< j ^), (11-2) 

其中 et 和 7/ t 是独立的白噪声序列，二1，... ， r . 初始值 pi 或者给定，或者服从一 
个己知的分布，且与和 Vt 独立 （i > 0). 这里川是第 2 章中的随机游走，初始 
值为叫；讲是叫的观测版本，只多了噪声 et . 在文献中，叫称为序列的趋势，并不 
能直接观测到，而 2/ t 是观测数据，其观测噪声为 e t . 由于 e , 是序列不相关的 ，故讲 
的动态依赖性由糾的动态依赖性所决定 • 

利用 （11 .1) 式和 （11 .2.1 式的模型可以很容易地分析某项资产价格的已实现波 
动率，可参见下曲的例 11.1 这里叫代表资产价格潜在的对数波动率，讲是已实现 
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波动率的对数.真正的对数波动率并不能被直接观测到，但它可根据随机游动模型 
而随时间演变.另一方面， y , 由高频交易数据构建.从而受到市场微观结构影响的 
约束. e < 的标准差代表刻度，用来衡量市场微观结构的影晌 

(11.1) 式和 ( H -2) 式的模型是 一个特殊的线性高斯状态空间模型 (linear Gaus ¬ 
sian state-space model ). 变量叫代表系统在 i 时刻的状态且不能被直接观测 
到. (11.1) 式给出了数据执和状态的联系，称 为測量误差为 e t 的观測方 
程 (observation equation with the measurement error e ^). (11.2) 式决定了状态变 
量随时间的演变方式，称为新息为 的状态方程 （或 状态转移方程). Durbin and 
Koopman (2001) 也称该模型为 局部水平模型 (local level model ). 另外，该模型是 
Harvey (1993) 中结构 N 间序列模型 (structural time series model ) 的 一 '种简单情形. 
与 ARIMA 模型的关系 

如果 (11.1) 式中没有测量误差，即= 0,则讲= / x t . 此时模型变为 ARIMA 
(0, 1, 0) 模型.若％ > 0,即存在测最误差，则为满足下式的 ARIMA (0,1,1) 模型 

(1 - B)y t = (1 - 6B)a t , ( 11 . 3 ) 

其中{叫}是均值为零方差为4的高斯白噪声 . 0和 d 的值由 〜和％ 决定.下 
面给出了该结果的推导. 

由 （11.2) 式，我们有 

(1 - B)fi t +i = T) t 或 糾十 1 = yZTb 1 ^ 1 ' 

利用该结果可以将 (11.1) 式改写为 

1 

Vt = n vt-i +e t . 

上式两端同时乘以 （1 - S ), 我们得到 

(1 - B)y t = rH-i +e t — e t _i. 

令 （1 - = w ; t , 可以得到 = 取 -i +e t - e t -i. 在前面的假定卜.很容易看出 

⑷叫 服从商斯分布； （b) Var(w/) = 2cr^ + (c) Co\{w u xut-\) = ⑷ j > 1 

时，有 Cov{w u w t -j) = 0. 因此叫 服从 MA(1) 模型.可以写成 叫 = (1 - 6B)a t . 
通 过让斯=(1 -⑽)的方差和延迟为1的协方差相等，可以 
得到 

(1 + 0 2 )a^ = 2(7^ + ctJ, Oal = a\. 

对于给定的 4 和 a 〗, 考虑上述两式的比值便可以得到一个关于0的二次函数.该 
二次方程有两个解，我们必须选择满足|(9| < 1的那个解 . a 〗 可以很容易得到.于 
是， (11.1) 式和 (11.2) 式的状态空间模型也是 ARIMA (0.1,1) 模型.它是第2章中 
的简单指数平滑模型. 
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另一方面，对于0为正的 ARIMA (0,1,1) 模型，可以利用上述两个等式解出4 
和 <，并且得到一个局部趋势模型.如果0为负，模型可以写成不带观测误差（即 
a c =0) 的状态空间的形式.事实上，我们以后将会看到， ARIMA 模型可以通过 
多种方法变换为状态空间模型.因此,线性状态空间模型与 ARIMA 模型是密切相 
关的. 

在实际中，人们只能观测到序列因此，若只是基于数据，则是利用 ARIMA 
模型进行决策还是利用线性状态空间模型进行决策并不关键.两个模型都有优缺 
点.在选择统计模型时，数据分析的目的、本质问题和经验都起到了很重要的作用. 
例 11.1 为了说明状态空间模型和卡尔曼滤波的思想，我们考虑 Alcoa 股票一天 
内的己实现波动率.时间区间是从2003年1月2 口到2004年5月7 口，共340个 
观测.所用的曰己实现波动率是一天内每隔10分钟的对数收益率的平方和，其中 
对数收益率以百分比形式给出.计算中没有用隔夜的收益率，即不用当天内的第一 
个 1 U 分钟的收益率.关于已实现波动率的更多信息可参见第3章.演示中所用的 
序列是日已实现波动率的对数. 

图 11-1 给出了 Alcoa 股票己实现波动率对数的时间图，时间区间是从2003 
年1月2日到2004年5月7日.交易数据来自 NYSE 的 TAQ 数据库.若采用 
ARIMA 模型，我们得到下述 ARIMA (0,1,1) 模型 

(1 — B ) y t = (1- 0.855^) a e , d tt = 0.5184， （11.4) 

其中讲已实现波动卒的对数，6的标准误差是 0.029. 残差序列给出 Q (12) = 12.4, 
V 值是 0.33, 这表明残差中没有显著的序列相关性.炎似地，残差序列的平方给出 
Q (12) = 8.2, v 值是 0.77, 这表明序列没有 ARCH 效应. 



天 


图 11-1 Alcoa 股票一天内的已实现波动率对数的时间图，时间区间是从2003年1月2曰 
到 200-1 年5月7 U . 已实现波动率用一天内每隔10分钟的对数收益率计算， K - 
中对数收益 率以百 分比形式给出 
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由于古是正的，我们可以将 AHIMA (0， U ) 模型转换为 （11.1) 式和 （11.2) 式的 
局部趋势模铟.两个参数的最大似然估计分别为~ = 0.073 5和^ = ( U 80 3.测 
量误差比状态新息有更大的方差，这证实了一天内的高频收益率要受到测量误差的 
约束.估计的细节将在 11.1.7 节给出.这里把这两个估计看成是给定的，并且只是 
用该模型来说明卡尔曼滤波的应用. 

11.1.1 统计推断 

回到 （11.1) 式和 （11.2) 式的状态空间模型.分析的目的是由数据 { y # = 
和模型来推断状态糾的性质.文献中经常讨论的有三种类型的推断. 
它们 是滤波 ( filtering )、 预測 ( prediction ) 和平滑 ( smoothing ). 令 F * = { yj ,• • • ,队}为 
t 时刻（包含 < 时刻）已经得到的信息.且假定模型（包括所有参数）是已知的.下 
面简要描述一下这三类推断. 

• 滤波：滤波意味着给定 F , 恢复状态变量即从数据中移除测量误差. 

• 预测，预测意味着给定预测川 + ,,或 y t+ht 九 > 0,其中是预测原点. 

• 平滑：平滑是指给定 F t ， 估计 /* t ， 这里 T>t. 

关于这三种炎型推断的一个简单的类比是读于写的注释.滤波是根据由注释开始 
所积累的知识来领会你要读的单词.预测是猜想下一个单词，而下滑是•旦你己经 
读了一遍注释.去解释个特定的单词. 

为了更精确地描述推断.我们引进一些符号.令= E ㈧ K ) 和 S t|i = 
Var ^ lFj ) 分 别为川 在给定&条件下的条件均值和条件力差.类似地 ，队 b 表 
示 Vt 在给定6条件下的条件均值.进一步，令 v t = y t - y tlt _ 1 和= Var ( v t | F e _,) 
分别为冏前一步预测误差和讲在给定条件卜的条件方差.值得注意的是， 
预测误差的与是独立的.因此 v t 的条件方差和无条件方差是相同的，即 
Varhli ^ OsVarO ^). 由 （11.1) 式， 

Vt\i-\ = = E(/x t 十 et|_Ft-i ) 二 E(/i£|F<_i) = 

因此，有 

Vt = Vt- Vt\t-1 =yt- (11.5) 

且 

V t =Vai(y t = Var(/i* +e t - 

= Var(/x t - 叫 wliVi) I Var(c t | J F t _ l ) = Et,*.! + cr^. (11.6) 

很容易看出， 

E(v t ) = E[E(t; t |F t _i.)] = E[E(yc — yt|i-i)J^-i)] = — = 0, 

Coy{v t , yj ) = E(v t yj) = = E[yjE(v t |Fi_i)) = 0 j < t. 
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于是，如所料想，向前一步预测误 差与巧 (j < t ) 不相关，从而独立.进一步，对 
于 （11.1) 式和 (11.2) 式的线性模型，有帅= EMF t ) = 叫）且= 

Var (^| F t ) = Var ^ l ^-,,^.). 换 言之，信 息集巧可以 写成只 = { F ^ yt } = 
v t }. 

下面给出多元正态分布的一些性质，它们对于研究正态假定下的卡尔曼滤波非 
常有用.可以利用多元线性回归方法或联合密度的因子化方法来证明这些性质，也 
可以参见第8章的附录 B . 对于随机向量切和 m ， 其均值向量和协方差矩阵分别 
表示为 E ( tu ) = E ( m ) =〜„ 和 Cov ( m , tw ) = S rnu> . 

定理 11.1 假设 x . y , z 是联合分布为多元正态分布的随机向量.另外，对7 u ; = 
x , y . z , 假定对角分块协方差矩阵 S 胃, 是非奇异的，且 Sp = 0.则 

(1) E { x \ y ) = 

(2) Var ( a :| y ) = E XI - 

(3) E ( x | y , z ) = E (®| y ) 4- E IS E ~ l (2-^)； 

(4) Vax ( x | y , z )= Vax ( x \ y ) - E « E ~ l E zx . 

11 .1.2 卡尔曼滤波 

卡尔曼滤波 (Kalman filter ) 的目 标是： 当获得一个新的数据点时递归地更新状 
态变量的信息.即已知&在 给定朽 ^条件下的条件分布和新数据我们意欲 
得到糾在给定尺条件下的条件分布，与前面一样，这里& = {奶，…， 1/,}. 由干 
F t = { Ff . uvt }, 从而给出 巧 和叫与给出和价是等价的. 因此， 我们只要 
知道 （ pm )' 在给定条件下的条件分布，便可以利用定理 11.1 推导出卡尔曼 
滤波. 

v t 在给定 F t _, 条件下的条件分布是均值为零的正态分布，方差由 (11.6) 式给 
出； 川在给定 F t - i 条件下的条件分布也是正态分布，且其均值为方差为 
进一步， ^ t , VtY 在给定条件下的条件分布也是正态的.因此,剩下的 
问题是求出叫和 v t 在给定条件下的条件协方差.由定义， 

Cov (^, v t | F t _ i ) - E (/ itt ； t | F t _ i ) = E [ fi t ( y t - (由 Eq . (11.5)) 

= +et — 

= - + E(^(et|F t _i) 

= E[(// t - ^ t \ t i ) 2 | F <_ i ] = Var(// t I /?；_!) = 5 ： tU t , (11.7) 

这里我们用到了 — = 0. 将上述结果综合在一起，我们有 

feL ， ([v] ， [5:: v：- 1 })- 
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由定理 11.1 知 . 仏在给定朽条件下的条件分布是正态的，且均值和方差分别为 





= Mt|t— 1 + K t v u 


( 11 . 8 ) 


^<|t = - 


: 

Vt 


—— K t ), 


(11.9) 


其中 是糾 关于 w 做回归的回! a 系数.通常称 为卡尔曼增益 (Kulmtin 
gain ) •由 (11 .8) 式知，卡尔曼增益决定了新扰动 q 对状态变量~的贡献. 

接 下来. 我们可以通过 （11.2) 式利用糾在 给定巧 条件下的信息来预测 
具体地.我们有 


^ t + i|t = E(^t + Vt \ F t ) = E ( ft t \ F t ) = (11.10) 


^t+i|t = Var(/it+i F t ) = Var(/i t |F t ) + Var(7 ； t) = &|t + #. (11.11) 

一旦观测到新的数据点 y t + lr 便可以重复上面的步骤来更新 / it + i 的信息.这就是 
著名 的卡尔曼滤波 算法.该算法由卡尔曼于1960年提出. 

综上所述，将 (11.5) (11.11) 式放在起，在初始假定.即叫的分布是 N ( fX M0 , 

Sl | 0 ) 成立的条件下，局部趋势模型的卡尔曼滤波为 


v t=yt 

Vt=S t | ( -i+o^, 

K t = ^t\t-i/Vt t ( 11 . 12 ) 

= + KtVt ， 

— — ^t) -I- < = 1 ， … ， T. 

卡尔曼滤波的推导方法有很 多种. 为了简便，我们这里是利用定理 11 . 1 , 即多 
元正态分布的性质来推导的.在实际中，初始值和 E 1 |() 的选取值得注意.关 
于该问题我们将在 11.1.6 节进行 讨论. 对于 (11.1 ) 式和 (11 .2) 式给出的局部趋势 
模型.参数〜和％可以通过最大似然方法估计出来.此外，在估计过程中，卡尔 
曼滤波在求数据的似然函数时也很有用.我们将在 11.1.7 节讨论估计问题. 

例 11.1( 续）为了说明卡尔曼滤波的应用，我们给 Akua 股票收益率的日己实现 
波动率拟合了状态空间模型并将 K 尔曼滤波算法应用于该数据，这里 E 1|Q = OQ ， 
// i|o = 0. 11.6 节将讨论这些初始值的选取•图 ll -2 a 给出了滤波状态变童/_的 
时间图，图 ll -2 b 给出了向前一步预测误差％的則间图.与图 11-1 比较.滤波状态 
更 平滑. 预测误差似乎很稳定地分布在0的附近.并且以 I )为屮心 . 这些预测误差 
都是样本外向前一步预测误差. 
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( a ) 滤波状态变萤 



图 11-2 基于局部趋势状态空间模型，将卡尔曼滤波应用与 Alcoa 股票日对数已实现波动 
串时所得到的时间序列图： （ a ) 滤波状态 ut | t : ( b ) 向前1步预测误差 

11.1.3 预测误差的性质 

向前一步预测误差在很多应用中都很有用，因此它们的性质值得我们仔 
细研究.给定初始值 E ll0 和 , u 1|0 (这些值弓独立)，卡尔曼滤波使得我们可以递归 
地计算叫，这里 t ， t 是 { yi , ，讲}的线性 函数. 具体地说，通过重复替代，我们有 

n=vi 一師， 

V2 = V2-^2\l = V2- ^1\0~ Ki{yi — 0110 )， 

V3=V3 - fi3\2 = 2/3 - ^i|o — K2[y2 — Mi|o) - i^i(l — K 2 )(yi — Ml|0 )， 

等等，此变换可以写成如下矩阵形式 

v = K ( j /-/ ii | 0 l T ), (11-13) 

其中 v = ( v ir -, v T y,y = (奶，… , y T )\ It 是: r 维单位向量 . K 是下三角矩阵， 
且定义 如下： 

1 0 0 -o' 

/^21 1 0 ... 0 

K = k 3 i k 32 1 0 ， 

• hpi kT 2 左 T 3 - 1 

其中 = —/ Ci-i 且 fcy = —(1 - - K »_ i)(l — Ki - 2 ) … (1 — Kj + i ) Kj(i = 2, • • , T , 

j = 1, …， i -2). 需要说明的是，从定义上看，卡尔曼增益既不依赖于 u 1|() 也 
不依赖于{奶，…，讲}，而是依赖于 S 1|0 , 心 2 和 
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(11.13) 式的变换有一些重要推论.首先{叫}在正态假设条件下是彼此独立的. 
为了说明这点，考虑数据的联合概率密度函数 

T 

P ( v ，… = p { yi ) Y [ p { yj \ Fj - i ). 

J=2 

(11.13) 式指出从讲到的变换是一个单位 Jacobian 矩阵，因此有 p ( w ) = p ( y ). 
再者，只要叫 0 给定，则 pM = p ( Vl ). 因此， V 的联合概率密度函数是 

T T T 

p(v) = p(y) = p(yi)Hp (的 l F w) = = Up( v j)- 

3=2 j i =2 

上式说明 { t ， t } 是彼此独 立的. 

其次，卡尔曼滤波给出了 y 的协方差矩阵的一个 Cholesky 分解.为了说明这 
点，设 n = Cov ( j /). 从 (11.13) 式可知 Cov ( w ) = KflK\ 此外， { v t } 彼此独立且有 
Var ( v t ) = V t . 因此 KilK' = diagfV ^, • • • , W }, 这正是 的一个 Cholesky 分解. 
矩阵 K 的元素屯，有一个很好的解释.参见第10章. 

状态误差的递归 

再看状态变量的佔计误差.定义 

Xi = (M 

为状态变量 u t 在给定条件下的预测误差.由 11.1.1 节可知， Var ( a : t | F t _ 1 ) = 
.由 （11.12) 式的卡尔曼滤波，我们有 

^ = yt fH\t-i = + et — /xt\t-i = 抑十 e *， 

和 

= Ml 十 1 一 = IM + ”t — 

= x t + Th - K t v t = x t + T} t - K t (xt +e*) = L t xt + 极一 K t e t , 

其中 L t = 1 K t = \ = (Vi - ^ t \ t - i )/ V t - al / V t . 因 ilWT 状态误差， 

我们有 

ut—xt + e t , x t +i = L t x t + n t - K t e tl t = 1, ••- , r, (11.14) 

其中有 A = 心 - u 1|0 . (11.14) 式是带有状态变量抑和观测值的时变状态空间 
模型 • 

11.1.4 状态平滑 

下面，我们考虑状态变量 （7 f .， u r ) 在给定数据 Ft 和模型时的估计.即，给 
定 (11.1) 式和 （11.2) 式的状态空间模型，对所有时间 t ， 我们希望得到条件分布 
n t \ F T . 为此，我们首先回顾一下该模型所包含的一些事实. 
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• 所有涉及到的分布都是正态的，当< < 了时,我们可以将^在给定条件下 
的条件分布写作 AT ( w t | r , S t | r ). 我们称为 < 时刻的平滑状态 (smoothed 
state ) 而 Et|r 称为平滑状态方差 (smoothed state variance ). 

•由 11.1.3 节中 { vt } 的性质可知， , vr } 彼此独立且为 { y x , • • •， i / T } 的 
线性函数. 

• 如果奶 ，…， yr 是确定的.则 Fm 和{叫.… ,抑} 都是确定的，反之亦然 
• {叫，… ， v r } 和 Ft - i 是独立的且均值为0、方差为 Var ( tv ) = Vj(j > t ). 

对于 { u t , v u - - , v r } 在给定 F t _ t 条件下的条件联合分布应用定理 11.1(3), 
我们有 

lh\T = E(/J4|Ft) = E(/xt|F t _i,v t , ••- ,vt) 

= E(/i f |F f _i) + Cov[/i tl (v«, • - • ,wt)’]Cov[(w“ … ,W5p) / ]~ l (vt, ,vt)' 


Cov(fi t ,v t ) 

t 

m Vt 0 … 0 

一 l 

Vt 

Cov(/i t ,v t+l ) 


0 Vi+i … 0 


Vt+1 

Cov(j 2 t,vr) 


0 0 • • • Vt 


Vt 


= + ^2 Cov ( pt , Vj ) Vf l Vj . (11.15) 

3 =t 

从的定义和独立性可知， Cov(w t , Vj ) = Cov ( x t , Vj)(j = l ，-.- , r ), 且 
Cov(x<,v t ) = E[xi(x f -fe t )] = Var(a ： i) = 

Cov(x t ,v t+ i) = E[x t (a ； H.i +e t+ i)] = E[x t (L t x< +vt~ K t e t )] = S<|t_ 山 . 

类似地，我们有 

Cov(a ； t ， vt+2) = E[a?t(a ； t4.2 + et+2)j = •••== 


Cov(x f ,v r ) = Ela^r + e r )]= 


因此， (11.15) 式变为 


T-l 

=][J Lj. 

j_=* 




其中 
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Qt-i = ^ -h + L t L t+l ^ + • • • -f ( 豆 、 )g (U.16) 

是新息 H，... , VT } 的加权线性组合.该权重和满足 

取- 1 = ^ + Lt = + ^+ 1 ^如.. + ($ 1 ^)铎 =v t +Ltqt ' 

因此，利用初始值打-(】,我们得到向后的递归 

坍 - 1 = 岩十 A% t = r,r-i,... , 1 . (H.17) 

综合考虑 （11.15) — (11.17). 我们得到一个计算平滑状态变量的向后递归算法： 

= yf lv t + L tQt, fit\T = + ^ = r, • • • , li ( 11 . 18 ) 

其中 gr = 0, 且 utit - i , E t | t -i 和 L* 由 (11.12) 式中的卡尔曼滤波给出. 

平滑状态方差 

平滑状态变量的方差 Ut|T 可以通过定理 11.1(4) 用相似的方式推导出来.具体 
地，令< = { Vt ， …，卹厂，则我们有 

^t|r — Var(^|Fr) = Var(/x t |i^_i，ut，... , Vr) 

= Var(/^|F t _i) - Cov [糾， ( vj ) r ] Cov [( vJ )] - 1 Cov[^, ( vf )] 

T 

= S «U-1 - QCovW，!^)] 2 》 -1 ， (11.19) 

i=t 

其中 Cov(u*， Vi ) =Cov(x*， Vj ) 如先前 (11.15) 式后给出的.因此 

E t|T = - - h (E^ 2 ) * 

= - ⑽ -1， （11.20) 

其中 

= * + + 服 1 士 + … + ( 君 4) 士 
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是时刻<-1后向前1步预测误差方差倒数的加权线性组合.因为得不到时刻： T 后 
向前1 步误差,所以令= 0 . 统计量 M t . { 具有形式 

^ +£?+ *v^ + - + (n i i? )w 

=士 + LfMt，t = T ， r-1 ， ... ， 1. 

由 （11.16) 式和 { v t } 的独立性，我们有 

综合考虑上述结果，平滑状态变量的方差很容易通过向后回归计算出来 

Mi-y = V], -1 + L^Mt, S t |r = — t = T } -'- , 1, (11.21) 

其中 Mr = 0. 

例 11.1 ( 续）利用给 Alcoa 股票的日已实现波动率所拟合的状态空间模型.将卡 
尔曼滤波和 (11.18) 式与 （11.21) 式的状态平滑算法应用于其中，我们很容易计算 
出滤波状态平滑状态 u <|: r 和它们的方差.图 11-3 给出了滤波状态变量和它 
的置信水平为95%的逐点置信区间的时间图，而图 U -4 给出了平滑状态变量和它 
的置信水平为95%的逐点置信区间的时间图.如所料想,平滑状态变量比滤波状态 
变量要平滑一些.平滑状态变量的置信区间也比滤波状态变量的置信区间窄.值得 
注意的是，的95%的置信区间的宽度依赖于初始值 S 1)0 . 



图 11-3 基于给 Alcoa 股票收益的日对数己实现波动率所拟合的局部状态空间模型，给出 
滤波状态变量和它的置信水平为95%的逐点置信区间 


M 卜 1 = 去+尤? 
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图11~4基于给 Alcoa 股票收益的日对数已实现波动率所拟合的局部状态空间模型，给出 
平滑状态变量和它的置信水平为95%的逐点置信区间 

11.1.5 缺失值 

状态空间模型的优势在于处理缺失值.假设观测值 { y t } e t ti +1 是缺失的 
且1 < £ < r ). 在状态空间的公式里有好几种处理缺失值的方法.我们考虑其中一 
种方法使得原始的时间刻度和模型形式保持不变.对于 p + l ，... J 十 q .根据 
(11.2) u t 可以表示为 叫 + 1 和{^} 51 } + 1 的线性组合来表达.具体地， 

e —1 

Pi =柃-1 +印=糾+1 + ^2 rjj , 
j = i+i 

其巾，如果求和式的下界比上界还大则该求和式为 0. 因此对于以{£+1，... ，蚪 h} , 
= E{nt\Fi) = /v+i |，， 

Var (^l-ft-i) - Var(/i t |F/) = E £+1| , 十（亡一 £ 一 l)aj. 

所以，对于《 = € + 2,…，/ + /»，我们有 

M 中 -1 = Mt-l|t-2 ， &| 卜 1 = + ^ (11.2*2) 

这些结果表明，当< =^+1，…彳+办时，我们可以继续利用 ( H .12) 式的卡尔曼滤 
波算法，此时 《; t =0, K t = 0 . 这是很自然的，因为当价缺失时.将没有新的新息或 
者新的卡尔曼增益，因此有叫= 0和& = 0. 

ll -1 .fi 初始化效应 

本小节将考虑初始条件 W 〜 ^( uno . Sno ) 对卡尔曼滤波和平滑状态的影响. 
由 (11.12) 式的卡尔曼滤波 

w i = y! _ a*i|o. = Sj| 0 + ^c> 
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且由 （11 .8)—(11.11) 式， 


^2|1 — H-ljO ^ 一尸 】 111 I + C7 2 X 严 

E2|1 = S 1|0 (l- +<7 ? = + 略 

因此，设 5^10 增大到无穷，我们有 w 2U =讥且1：^ =4 + 4. 这等价于将 yi 看 
作不变，且假定的〜 N ( yi H 在文献中，这种初始化卡尔曼滤波的方法叫做扩散 
初始化 (diffuse initialization ). 因为 Sqn 取值很大意味着初始条件的不确定 • 

下面，再看扩散初始化对状态平滑的 影响. 很显然，基于卡尔曼滤波的结果，状 
态平滑不受扩散初始化的影响 (* = T ,--.,2). 因此，我们主要讨论给定 Ft 条件下 
的 tn . 由 （11.18) 式和 h - 1 - 心= Vf 1 ^ 的定义，我们有 

Mi|T = /< i|o + E i | o 9 o 

= 叫。十 Si 1 。 kW 1 + ( 1_ 

设 E * — > oo , 我们有 ui\T = tii|0 + vi + 0^1 = yi + <7^ gi , 进一步，由 （11.21) 式，并 
利用朽= 5^0十(7,，我们有 

Sl|T = Sl|0 _ E? i 。 Ml ] 

= 〜。 0- e^i) ~{ l ~^hi) E? '° Mi 

= (s^f)^ 2- (s^f ) 机 

因此，令 S M0 - oo , 我们得到 St,r = W - o A e M x . 

基于 t 述讨论，我们建议在对初始值⑹了解较少的情况下利用扩散初始化. 
然而，在实际应用中，可能很难判断当随机变量具有无限方差时使用此方法的可行 
性.如果有必要，可以将〜看作状态空间模型的附加参数，并可与其他参数一起估 
计出来.后一种方法和第2章与第 8 章的精确最大似然估计密切相关. 


11.1.7 估计 

本小节将考虑由 (11.1 ) 式和 (11 -2) 式给出的局部趋势模 型中％ 和％的估计. 
基于 11.1.3 节所讨论的预测误差的性质，卡尔曼滤波给出了计算数据最大似然函 
数的一个有效的方法.具体地，正态假设下的似然函数为 
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jKyi ， ... ， VTke.ffr,) = p{y\\a e ,a v ) JJ(y« |F t _l, <r et <T,,) 

t =2 

T 

=p(!/i k e ，％) n( v *l F w 。 °v>), 

t=2 

其中扒 〜7 V ( ti 1|0 ， Vl ) 且 N {0, V t ). 因此，若假定 《 z 1|0 和 S 1|n 已 

知并取其对数，我们有 

\ n [ L { o e , a v )\ = -| ln (2 it ) 一吾 [ (峨)+ 香)， (11.23) 

上式包含和 K t . 因此，包括缺失值在内的对数似然函数，可以通过卡尔曼滤波 
递归地计算出来.许多软件包比如 Matlab , RATS 和 S - Plus 等都可以通过卡尔 
曼滤波法则进行状态空间模型的 估计. 本章中，我们利用 Koopman , Sh 印 hard 和 
Doomik (1999) 幵发的 SsfPack. 程序， S - Plus 与 OX 都包含该程序. SsfPack 和 
OX 可以从它们的网页上免费下载. 

11.1.8 所用的 S - Plus 命令 

这里我们给出对 Alcoa 股票收益率的日已实现波动率进行分析的 S S fPack 命 
令，并给出简要的 说明. 对于所用命令的详细细节，可以参考 Durbin and Koop - 
mnn( 2 001 ， 6. 6 节). S-Plus 使用特定的符号来指定状态空间模型，参见表 1M .这 
些符号必须完整无误.在表 II - 2 中，我们给出了一些命令和它们的 功能 . 


表 11-1 状态空间形式和 S - Plus 中的符号状态空间参数 


状态空间参数 


S- Plus Is 

6 

矛 


mDelta 

(1 


mOmega 

£ 


mSigma 


表 11-2 

SsfPack 包的一些命令 

命 令 


功 能 

SsfFit 


敁大似然佔计 

CheckSsf 


在 S-Plus 中创 建对象 • *Ssf ，， 

KalmanFil 


执行卡尔曼滤波 

KalmanSmo 


执打状 态平滑 

SafMomentEst with task 

<f STFIL ,J 

1 计算滤波状态及方差 

SsfMooiitEst with task 、 

1 ‘STSMO,• 

计 算平滑 状态及其方差 

SofCondDens with lank 1 

， ，srsM0, 1 

计算不带方差的 Y •滑状态 


在我们的分析中，我们首先对 （11.1) 式和 (11.2) 式的状态空间模型进行最大 
似然估计，得到 (7 e 和 (7〃 的 估计. 初始值= _ 1且 It 叩= 0,这里“_1”表示扩 
散 初始化，即， s l |0 很大.这时，我们把所拟合的模型看成是已知的，然后进行卡尔 
曼滤波 和状态平滑. 
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状态空间横型的 SsfPack 命令和 S-Plus 命令 


sigma.eta=parm[l] % local trend model 

3igma.e=parm[2] 

ssf.m=list(mPhi=as.matrix(c(1,1)), 
mOtnega=diag(c(sigma.eta A 2,sigma.e*2)), 
mSigma=as.matrix(c <P1,al)” 

ChenkSsf(ssf.m) 

} 

perform estimation 

ltm.mle=SsfFit(Itm.start,y # "ltm.m",lower ： 

upper=c(100,100)) 

ltm.mle$parameters 

.] 0.07350827 0.48026284 

sigma. eta=ltm. mle$parameter [1] 

sigma.eta 

.] 0.07350827 

sigma.e=ltm.rale$parameters[2] 
sigma.e 
.] 0.4802628 

Specify a state-space model in S-Plus. 
ssf.ltm.list=list(mPhi=as.matrix(c(1,1)) 


validity of the specified model 

> ssf.ltm=CheckSsf(ssf.ltm.list) 

> ssf.ltm 
$mPhi : 

【，1] 

[1J 1 

[ 2 ,] 1 


t,l] 【， 2] 

D054035 0.0000000 
0000000 0.2306524 
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% Smoothed states 

> SmoedEst. ltm=SsfMorrentEst (y, ssf • ltm, taak="STSMO") 

> names(SmoedEst.ltm) 

[1 】 "state_moment" "state.variance" "response.moment" 

[4] "response.variance" "task" 

% Obtain plots of filtered and smoothed states with 95% C.I• 

> up=PiledEst.1tm$atate.moment + 

+ 2*sqrt(FiledEst.ltm$state.variance) 

> lw=FiledEst.ltm$state.moment - 

♦ 2*sqrt(FiledEst.ltm$state.variance) 

> par(mfcol=c(1.1)) 

> plot(1:340,FiledEst.1tm$state.moment,type= * 1 *,xlab= , day , , 

+ ylab=* value*,ylim=c(-0.1,2.b)) 

> lines(1 ： 340,up,lty=2) 

> lines(1 ： 340,lw,lty-2) 

> title(main:*Filed state variable.) 

> up=SmoedEst.ltm$state.moment + 

+ 2*sqrt(SmoedEst.ltm$state.variance) 

> lw=SmoedEst.ltm$state•moment - 

+ 2*sqrt(SmoedEst.itm$state.variance) 

> plot(1:340,SmoedEst.ltm$state.moment,type=*1*,xlab=,day 、 

+ ylab-* value ', ylim=c(-0.1,2.5)) 

> lines(l:340,up,lty=2) 

> lines(l ： 340,lw,lty=*2) 

> title(main= # Smoothed state variable*) 

% Model checking 

> resi=KalmanFil.Itm$m0ut[,1]*sqrt(KalmanFil.Itm$m0ut[,3]) 

> archTest(resi) 

> autocorTest(resi) 

对于 Alcoa 股票收益的日已实现波动率，基十残差 分析. 局部趋势模型是充分 
的 . 具体地 . 对于给定的参数估计，利用卡尔曼滤波得到向前 1 步预测误差叫和 
它的方差怜然后计算标准预测误差色 = vt/VVu 并检査序列相关性和的 
ARCH 效应 . 我们发现对于标准预测误差有 Q(25)=23.37(0.56) 且检验 ^ ARCH 效应 
的延迟为 25 的 LM 检验统计量是 18.48(0.82), 其中括号里的数字表示 P 值 ‘ 

11.2 线性状态空间模型 

现在我们考虑广义的状态空间 模型. 许多经济和金融上的动态时间序列模型 
可以表示成状态空间模型的形式，例如 ARIMA 模型、带有不可观测元素的动态线 
性模型，时变回归模型和随机波动率模型.广义高斯线性状态空间模型具有如下形 
式 

= dt -\- TtSt + -RfT7 t1 (11.24) 

!/t = 十 Z t st + et, (11.25) 

其中 St = (s u ， … , s m t) r 是 m 维状态向童 ， J/t = (S/it ， … ， ya)' 是左维观测向量，忒 



和 O 分别是 m 维和 A . 维的确定性向量，7\和 Z t 分别是 m x m 和 fc x m 的系数 
矩阵，风是 m x n 矩阵.通常由 mxm 单位矩阵的子列构成，且{化}和 { e t } 分 
别是 n 维和 A ： 维高斯 Cl 噪声序列满足 


其中 Q , 和 ff , 是正定 矩阵. 我们假定{%}和 （ ei } 是独立的，但是在必要的时候 
这个条 件可以 放松.初始状态〜服从其中 UijQ 和是给定的, 
且对于 t > 0, e t ^ rf t 独立. 

( II . 25 )式是度量或者观測 方程. 该方程给出了观 测值队 与状态向量〜、解释 
变量 c t 和测量误差的联系. (11.24) 式是状态或转移 方程. 它描述的是带有新息 
化的一阶马尔科 夫链. 该马尔科夫链决定了状态的转移.矩阵 r ,, Q ,, Z , 和 

都 Q 知且称其为系统矩阵.这些矩阵通常是稀疏的.它们是某个参数0的函数 
且参数0可以通过最大似然方法估计. 

(11. 2 4)式和 (11.25) 式的状态空间模型可以被改写成如下更紧凑的形式 

[^ 11 1 + 十 ut (11.26) 


而且 { ti t } 是高斯白噪声序列，其均值为0、协方差矩阵为 


扩散初始化可以通过 


n ( = Cov(t* t ) - RtQtB：t 

o 

^ 1|0 = 



得到.其中 I 和”沈是 mxm 的对称正定矩阵，且 A 为大的实数，可以取到无限. 
在 S - Plus 和 SsfPack 使用符号 


s= 

• Al 0 - (m+l)xm 

参见表 11-1. 

在许多应用中，系统矩阵不随时间而变然而，这些矩阵也可以是时变的这使 
得状态空间模型更加灵活. 


11.3 模型转换 

为了领略状态空间模型的灵 活性， 我们将一些著名的经济和金融模型写成状态 
空间模型的形式. 
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11 . 3 . 1 带时变系数的 CAPM 

首先，考虑带时变截距和斜率的资本资产定价模型 ( CAPM ). 该模型为 

n = + et ， et 〜斤⑴， of), 

««+i=at -^Vu Vt ~ ( 1127 ) 

/3 t+ i = A + et ，£t ~ 

其中 r t 为某项资产的超额收益， r * M . t 是市场超额收益，且新息 { e t , Vt , et } 是彼此独 
立的.该 CAPM 里面的参数《和0以随机游动的形式随时间变化.我们可以很容 
易地将模型改写为 

[ r:]=M [$[:]， 

n =[ l ， r M , t ] [;:] + et - 

因此，时间序列 CAPM 模型是状态空间模型的-个特例，其中〜一 (a t ,(3 t y,T t = 
风=/ 2 是2 X 2单位矩阵， d t = 0， c t = 0 , Z t = 4 且 = 

diag {#， CTf }. 进一步，由 (1126) 式我们有 <5 t = 0, u t = (7? t , Et , et ) , 1 



L 0 


a v 

0 

0 


0 1 

,= 

0 

oi 

0 


1 TM,t 


0 

0 

< 


如果利用扩散初始化，则 

-1 0 
53= 0 -1 

0 0 

时变序列模型的 Ss/Pacfc/S-Plus 命令详述 

对于 (11.27) 式的 CAPM , 钇 包含 r M ， t , 且 r M , t 是时变的.在 SsfPack 里指 
定这样的模型需要一些特殊的输入.起码它需要两个附加变量 ： （ a ) 存储 Z t 的数 
据矩阵 叉； （ b ) 识别数据矩阵和 A 的指标矩阵•表11_ 3 给出了 (11-26) 式中状态 


表 11-3 SafPack/S-T*his 中关千时变状态空间樓型的符号及命名 


指标矩阵 

Ssf Pack/&-PUw 中的命名 

Js 

mJDelta 

J* 

mJPhi 

Jil 

mJOmega 

时变败据矩阵 

■Sa/Podfe/S-Plus 中的命名 

x ^ 
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空，模型的指标矩阵的符号.注意，矩阵必须和矩阵私有相同的维数.在 A 
的元素中，除非与它相对应的屯的元素是时变的，否则都设定为“一 1”. 的非 

负指标表明数据矩阵 X 对应的列包含时变值_ 

作为说明，考虑第9章中1990年1月至2003年 I 2 月的 General Motors 股票 
的月简单超额收益率- S&P 500复合指数的月超额收益率作为市场收益率.指定一 
个时变 CAPM 需要方差 < 4和4的值，这里假定 K ，< r e , cr e ) = (0.02,0.04, 0.1). 
下面的命令给出了如何在 SsfPack / S - Phm 中为时变 CAPM 指定一个状况空间 
模型： 

> x.mtx=*cbind ( 1, sp) * Here ,sp, is the market excess returns. 

> Phi.t = rbind(diag(2) r rep(0,2)) 

> Sigma=-Phi.t 

> sigma.eta=.02 

> sigma.ep=.04 

> sigma .1 

> Omega=diag(c(sigma.eta*2,sigma.ep A 2,sigma.e A 2)) 

> JPhi = matrix(-1,3,2) * Create a 3-by-2 matrix of -1. 

> JPhi[3,l】=l 

> JPhi[3,2]=.2 

> ssf.tv.capm=list(mPhi=Phi.t, 

+ m0mega=0mega, 

+ mJPhi=JPhi, 

+ mSigma=Sigma, 

+ mX=X.mtx) 

> ssf.tv.capm 
$mPhi ： 

r.n r, 2 i 
Cl,] 1 0 

[2,] 0 1 

[3 J 0 0 

$mOmega : 

[,1] [,2] 【， 3 】 

11,] 4e-04 0.0000 0.00 
[2, ] 0e + 00 0.0016 0.00 
[3,] 0e+00 0.0000 0.01 
$nuJPhi : 

1,1] 1,2] 

11,] 1 -1 

[2, J -1 -1 

[3 J 1 2 

$ mSigma ： 

1,1] 【， 2 】 

[1J -1 0 

[2,] 0 -1 

【 3,] 0 0 

$tnX : 
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numeric matrix ： 168 rows, 2 columns. 

sp 

[1,】1 -0.075187 
【 168 ,] 1 0.05002 

11.3.2 ARMA 模型 

考虑第 2 章中均值为 0 的 ARMA ( p , g ) 过程 y t , 

4>(B)y t = 0(B)a t ， a t - (11.28) 

其中 <p{B) = 1- f ： 0(B) = 且 p 和 g 为非负整数.有许多方法 

可以将这样一个 ^ MA 模型转化为空间模型的形式.我们讨论文献中已有的 
三种方法.令 m = max ( p，(7 + l ) 且将 （11.28) 式中的 ARMA 模型重新改写为 

m m — 1 

yt = > : (fnilt-i 十 (h — ^ : (11.29) 

t=l J =1 

其中也== 0(»: > P ) 且心 = 0(?' > 9). 特别地， 0 m = 0( 因为 m > 9). 

Akaike 方法 

Akaike (1975) 将状态向量&定义为包含在预测原点 t 进行预测所需要的所有 
信息的变量的最小集合.对于 （11.28) 式中的 ARMA 过程， 有 m = max ( p , q + l ), 
s t = ，!/ t + m - i | t )'， 其中 Vt + j\t = E ( yt + j | F t ) 是给定巧 ={ yi ， …，! / t } 

条件下的条件期望•因为 ？/ t|t = I / t ， 故〜的第一个元素就是 y t . 从而观测方 
程为 

yt = Zs t , (11.30) 

其中 Z =( l ,0, --,0) i xm . 通过以下几步推导可以得出转移方程.首先，由定义 

Si , t+1 = Vt+i = Vt+i\t + ( yt+1 — = Sat + at , x , (11-31) 

其中〜是〜的第 i 个元素.其次，考虑第 2 章给出的 ARMA 模型的 MA 表示, 

也就是 沈 

yt =屯 + 必 1〜-1 + V^at-2 H - - 5Z 也叫 

»=o 

其中咖 )= 1且分的其他权重可以通过计算1 + g 咖 B * = 0( 丑) /0( B ) 中丑*的系 
数得到.特别地，我们有 

沴1 = 泠1 _设1， 

1 p 2 — 01^1 + h —设2， 
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V’m 1 =冷 lV’m 2 + 02 V ’ m -3 + • • • + 彡 m -2畛1 + — 0 m - 1 

m-1 

= X ]也 - 设 m-1. 


(11.32) 


利用 MA 表示，对于 j > 0 ,我们有 

l/i+il* = E^+jlFt) = E (E i/um Ij. <|F t ) 

= ^jat 4 - V>>+io t _i + i> j+ 2<h—2 + • •. 

和 

的十 iU 十 i = E (Vi 十十 l) = +^fja t I xf)j + ia t -\ H - 

=V'j-iot+i 十 y t 七 it. 

因此对于 j>0 我们有 

yt-\-j\%+x = f (n.33) 

该结采称为 ARMA 模型的预测更新公式 . 若讲可以得到，该方法给出了一个简 
单的更新预测的方法 . 即预测原点从 t 变化到 t + 1. t/ m 的新信息包含于新息 屯 +1 
中，基于该新信息及 权重办 修止预测原点为 < 时刻的预测，并计算预测原点为 
(« + 1) 时刻的预测 . 

最后，由 (11.29) 式并利用 E(a t+i | F t+l ) = 0(j>l ), 我们有 

m 

Vt+m t+l — 0tVt-nn-ilt+l — 

»=1 

由 （ 11.33) 式，前面的等式变为 

m—1 

= 扒 ( 队 -f 一 ^m-lOt+1 

t=l 

^ /m—1 、 

一 少咖十 m - i|t + ( — 没 m - 1 ) at+1 

«=1 \ t=l ) 

m 

Y1 也 Vt+m-i\t + 咕 m- ia t +u (11.34) 

-1, 联合 （ 11.31) 式、 （ 11.33) 式 


i^X 


最后一个等式运用了 （11.32) 式.对于 J = 2,. 
(其中 j 二2 ，... ，m - 1) 和 （11.34) 式，我们有 


Vt+i 


' 0 

l 

0 

0 


yt 


'1 ' 

yt+2|t+i 


0 

0 

l 

0 


Vt+i\t 

+ 

01 



0 

0 

0 

1 


J/t-l-m—2|t 


0m-2 

. 2/t+m|i+l . 


S^iri 

1 


<6i. 


.Vt+m-X\t. 


• V，m 1 _ 


• (11.35) 
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因此， Akaike 方法的转移方程为 

s t +i = Ts t + Rq t , rjt 〜 (11.36) 

其中爪 - ot +ll 且 T 和 /Z 是 (11.35) 式中的系数矩阵. 

Harvey 方法 

Harv e y(1993, 4.4 节）给出了具有 m 维状态 向童〜 的状态空间的一种形式. 
该状态向量的第一个元素是的，即=识 .和 的其他元素通过递归得到.由 
ARMA(m，m - 1) 模型.我们有 

m m — 1 

Vt+l = 01?/t -I- ^2 ~ -|- flt+1 

t=2 j=l 

= + S2t + Vt, 

其中 S2t = 5Z ~ Vt — Oi+1 且如前述定义 Sit — 考虑 

*=2 j=l 

«2,t+l, 我们有 


»2,t+l = ^ < f > iVt +2 -i — 

i=2 i=l 

m m — 1 

= <f> 2 Vt + <f>iyt-\- 2 -i — 53 ^J a *+ 2 -j — 设 十 1 

i=3 j=2 

= < f > 28\t + »3t + (—(?l)7^, 


其中 《3t = Z) 0*yt+2-i — ^i a t+2-i， 下一步，考虑 

<=3 i=2 


*'3.e+l, 


我们有 


♦ ， 3,t+l = 也识 +3-» — 5Z 

<=3 j=2 

m m—1 

=<hyt + y~l <PiVt 十 3-i - ^i a *+3-j + (一设 2)at+l 

t=4 j=3 

彐 <h 8 lt + 4 - ( 一沒 2)W ， 

其中 S 4t = E < f > iy t ^^i - 十 3-J. 重复上述过程 i 可以得到 

i=4 Jf=3 

m m — I 

Smt = 5 Z — 沒 jat+m-l-j = <l>myt-l - 

i=m i=m— 1 


最终有 


^m.t-f-1 = ^mVt — 沒 = 十 ( 一 ^m—i )Vt* 






将上述方程综合起来，我们得到如下形式的状态宇间 模型： 

« t+i = Ta t + Rrjt , rjt 〜 AT (0, ffJ ), (11.37) 

Vt = Zst , (11.38) 

其中的系统矩阵不随时间变化且定义为 Z = (1,0，... ,0 ) lxmi 
<f>i 10 

<h o 1 

T = I 

<f>m-l 0 0 

.0m 0 0 

且 dt , 和坧都是零. (11.37) 式和 (11.38) 式的模型没有测量误差.它的一个优 
点是 AR 和 MA 系数被直接用在了系统矩阵里. 

Aoki 方法 

Aoki (1987, 第4章）讨论了将一个 ARMA 模型转化为状态空间模型的几种 
方法.首先，考虑 MA 模型.即在此种情况下，我们可以简单定义 
»t = ( a t q , n t 9 I 2 . • • • , o-t i )\ 并得到状态空间模型形式为 




Vt = (一设 9, — ^q-i> …， — ®i)*t + o-ti (11.39) 

注意，在这种特殊情况下， a t 同时出现在状态方程和测量方程中. 

其次，考虑 AR 模型，也就是说 < f >{ D ) z t = a t . Aoki (1987) 介绍了两种方法.第 
—种方法直接定义和=(办 — 奸!，… , z t )', 得到 



Zt = (0,0,…,0, l)s t . 


(11.40) 
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第二种方法中定义状态向量的方式与第一种方法一样，只是从最后一个分量里去除 
了 at ; 也就是说，如果 p = 1，则= z t - a t \ 如果1,则和=(為 — p + i , … , z t - x , zt - 
a t y . 简单的代数运算可以证明 




0 

1 

0 

0 


為一 p+l 


0 



0 

0 

1 

0 


之 t—p+2 


0 

Zt 


0 

n 

0 

1 




l 

.A+i — a t \ \ . 


.0P 

0p-l 

<Pp-2 



• H 


• <h . 


«t = (0,0, -- ,0, l)«t +0t- (11.41) 

a t 再一次同时出现在转移方程和测量方程中. 

下面考虑 ARMA ( p ^) 模型 4>{B)y t = d{B)a t . 为简便，不妨设 q > p, 引入辅助 
变量 zt “ 则有 

= a t , y t = B { B ) z t . 

因为々是 AR{p) 模型，我们可以用 （11.40) 式和 （11.41) 式的转移方程.如果用 
(11.40) 式，我们可以利用 y t = e ( B ) z t 建立如下测量 方程： 

Vt — [—0p-i t —0 p -2, ••• , —沒 1 ， l)«i, (11.42) 

其中？; > y 且当 j g 时有内= 0. 另一方面，如果用 (11.41) 式的转移方程，我们 
可以建立如下测量 方程： 

Vt — (― ^p-x> — 设 p-2, …， —l)«t +a t . (11.43) 

总之，一个 ARMA 模型可以有多种状态空间模型表示.每种表示方法都有 
其优缺点.可以选择这些表示方法中的任何一个来进行估计和预测从另一方面 
讲， （11.24) 式和 （11.25) 式的状态空间模型的系数不随时间变化.可以利用 Cayler - 
HamUton 定理来证明 观测％ 服从 ARMA ( m , m ) 模型，其中的 m 是状态向量的 
维数 

SafPack 命令 

在 < Ss / f * acA :/ S-Plus 中，可以利用命令 GetSsf Arma 将 ARMA 模型转化为状态 
空间形式，所用方法为 Harvey 方法.为了进一步说明，考虑 AR (1) 模型 

Vt = O-Gj/t-i H a t , a t ~ N(0, 0.4 2 ). 


该模型的状态空间模型为 
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> ssf.ari = CJetSsfArma (ar=0.6, sigma=0.4) 

> ssf.ari 
$mPhi ： 

t,l] 


[ 1 ,] 0.6 
[2.】1.0 



【 1,1 0.16 0 

[2,】 0.00 0 

$mSigma ： 
t,l] 

tl,] 0.25 

[ 2,1 0.00 


由于 AR (1) 模型是 T 稳的，程序利用了 S 1(0 = Var ( y t ) = (0.4 ) 3 /(l - 0.6) 2 = 0.25 
和 /^i|o = 这些值出现在矩阵 mSigma 里. 

作为第二个例子，考虑 ARIMA (2,1) 模型 


yt = 1.2 y t 一 1 — 0.35 yt _2 十 - 0.25 a t _ i , a t ~ iV (0, l . l 2 ). 


该模型的状态空间形式为 

> arma21.ro * list(ar=c(1.2,-0.35),ma«c(-0.25) # oigma=l.l) 

> ssf.arma21= GetSsEArma(model=arma21.m) 


> ssf 

•arma21 

$mPhi 

Ml 1,23 

[1,1 

1.20 1 

【 2,] 

0.35 0 

[3 ,】 

1.00 0 

$mOmega : 


[,1] 1,2) [,3] 

uj 

1.2100 -0.302500 0 

【 2,】 . 

-0.3025 0.075625 0 

13,] 

0.0000 0.000000 0 

$mSigma : 


1,1] 1.2) 

iu 

4.060709 -1.4874057 

U,1 - 

-1.487406 0.5730618 

【 3,1 

0.000000 0.0000000 


如所料想，结果表明 


1.2 

-0.35 


z = (i ， o )， 


且 mPhi 和 momega 满足 (11.26) 在 mSigma 里用到了（讲，讲- 1 )'的协方差矩阵. 
注意在 SsfPack M , 假定 ARMA 模型的 MA 多项式具有形式 (9(5) = 1 + + 

…+心/^，而不是大多数文献中的 6{, B ) = \- e x B - Q q B 、 
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11.3.3 线性回归模型 

多元线性回归模型也可以表示成状态空间的形式.考虑模铟 
y t = + e t , e t AT(0,<r^), 

其中是 P 维解释变量而是一个 p 维的参数向量 . 对于所有的 f 令 = /3 .这 
时模型可以写为 

hr]m 

因此，系统矩阵为 r t = J p , = ac ;， dt = 0, Ct = 0, /f t = 0 且 Q, = of . 因为状态 

向量是固定的，所以应使用扩散初始化方法 . 

我们可以将回归模型进行拓展使得汍为随机的，即 


= Pt + RtVt、Vt 〜 iV (0,1), 

且抝= ( q ，… , a p y , ai ^0. 如果 q = 0,则啟不随时间变化 • 

SsfPack 命令 

在 Ss / Padfc 中，命令 GetSsfReg 为多元线性回归模型创建了一个状态空间形 
式.命令有一个输入自变量，包含解释变量的数据矩阵.为了进一步说明，考虑简 
市场模型 

rt = Po + 0 irM , t +^ t , t = 1, - • • , 168, 

其中 n 是某项资产的收益，而 7^,, 是市场收益（例如， S&P 500复合指数收益）状 
态空间形式可以通过如下命令获得. 

> eef.reg-GetSefReg(cbind(1,op)) % % sp # io market return. 

> ssf.reg 
$ mPhi : 

【，1】 

tlj 1 

【2,】 0 

13,】 0 

$mOmega : 

i , i ] 

[1 J 0 

【2.】 0 

[3 J 0 

$ mSigma ： 

[,1] 

U.l -1 

【2,] 0 

13 # J 0 

$mOPlii ： 
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[,1]【，2】 

【 1 ,】 -1 -1 

[2.J -1 -1 

[3,] 1 2 

$tnX: 

numeric matrix ： 168 rows. 2 columns. 
sp 

tl,] 1 -0.075187 
[168,] 1 0.05002 

11.3.4 带 ARMA 误差的线性回归横型 

考虑带有 ARMA(p,g) 误差的回归模型， 

Vt = + zt> 4 >{B)z t = 6 {B)a ty (11.45) 

其中~ _，4)且: r t 是 A 维解释 变量. 该模型的一种特殊情形是非零均值的 
ARMA(p,g) 模型，此时对子一切〜=1且/3变成了纯量参数.设&是々序 
列的一个状态向量.比如，如 （11.37) 式定义的那样.我们可以定义 yt 的状态向量 
为 

<=[;:]， （11.46) 

其中对于一切 < 有汍=/9,这时 y t 的状态空间形式为 

a <+i = + Ft* rj t , (11.47) 

Vt = (11.48) 

其中 Z: - (1,0, … ,0,a;{) lx(m+fc) , m = max(p，g + 1) 且 


T* = 

T 

0 

w = 

R 


0 

I k 


0 


其中的 r 和由 （11.37) 式所 定义. 我们可以用如下紧凑的形式给出状态空间 
模型 

[IrHSld. 

SufPack 命令 

对于带有 ARMA 误差的线性回归模型， SsfPack 利用命令 GetSsfRegArma 建 
立其状态空间形式.可以用命令 args(GetSsfRegAnna) 找到该命令的自变量,包括 
解释变量的数据矩阵和 ARMA 模型的指定 • 为了进一步说明，考虑模型 

yi = A) + Pix t t = 1,-.. , 168, 
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zt = l.2zt~i - 0.35zt_2 + at — 0.25at_i, at ~ iV(0,o^). 

我们用符号 X 表示 r x 2 回归向量矩阵 (l,xO. 前述模型的状态空间形式可以通 
过如下命令得到 

> ssf.reg.arma21=GetSsfRegArma(X,ar=c(1.2 , -0.35) # 

• ma « o (-0.25)) 

> ssf.reg.arma21 
$mPhi : 

【，1】 [,2】 I # 3] 【，4】 


[1,] 1 

20 

1 0 

0 



[2,] -0 

35 

0 0 

0 



[3,] 0 

00 

0 1 

0 



[4,1 0 

00 

0 0 

1 



[5.] 1 

$mOmega 

00 

0 0 

0 



[ 

1] 

[,2 】 1/3 】 

[,4 】 

1,5] 

【 1,】1 

00 

-0.2500 0 


0 

0 

[2,] -0 

25 

0.0625 0 


0 

0 

【 3,】0 

00 

0.0000 0 


0 

0 

[4,] 0 

00 

0.0000 0 


0 

0 

15,) 0 

$mSigroa 

00 

0.0000 0 


0 

0 


【， 1 】 1,2] 

[,3 】 

【， 4] 

[1,1 3 

•35595 -1.229260 


0 

0 

[2,] -1 

.22926 0.473604 


0 

0 

【 3,] 0 

.00000 0.000000 


-1 

0 

[4,] 0 

•00000 0.000000 


0 

-1 

[5,] 0 

.00000 0.000000 


0 

0 

$nvJPhi : 






I, 

1 】 

【， 2] [,31 [,4] 



[1 ,】 

-1 

•1 -1 - 

1 



t2 f ] 

-1 

—i -1 - 

1 



【 3,] 

-1 

-1 -1 - 

1 



[4,] 

•1 

-1 -1 - 

1 



15J 

-1 

-1 1 

2 




$mx： 

numeric matrix ： 168 rows, 2 columns, 
xt 

[1,] 1 0.4993 
【 168,] 1 0.7561 

11.3.5 纯量不可观测项模型 

最基本的一元不可观测项模型，或者结构时间序列樓型 (structural time series 
model, STSM), 具有形式 

I/i = /^ + 7t + + e t , (11.49) 

其中糾，和巩分别表示不可观测的趋势项、李节项和循环项•且 e t 表示不可观 
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测的不规 则项. 在文献中，通常用非平稳（可能带二重单位根）模型来描述趋 势项： 

= 取〜 7 V (0, o ^)， 

其中 Mi 〜 "(( U ), A 〜 AT (0, O , e 是一个较大的实数，比如 $ = 10 8 . 可参见，例如 
Kitagawa and Gersch (19 nfi ). 如果％ = 0,则川服从带漂移负的随机游动.如果 
% = 0,则仏表示确定性的线性趋势. 

假定季节项％具有如下形式 


(1 + 召 + •.. + B a ~ x ) lt = uj u 叫〜 N (0,( x 1), (11.51) 

其中 s 是一年中季节的个数.也就是季节项的周期.如果<^ = 0,则季节项就是确 
定的. 假定循环项具有如下形式 


吻 +1 = ^ cos(A c ) sin(A c ) 1 zj t e t 

. 」 -sin(A c ) cos(A c ) J e ； 

其中 

te 卜斤0 1-<52)/2 )， 


(11.52) 


〜 7 V (0， af )， 却〜 AT (0,4)， 且 Cov ( ti ； o , t 375) = 0, rfe (0,1] 为阻尼因子，且循环 
的频率是 A c = 2 jt / g , 以 g 为周期.如果 <5 = 1，则循环变成确定性的正弦余弦波动. 
SsfPack/S-p\ua 命令 


利用命令 GetSsfStsm 可以给结构时间序列模型建立一个状态空间形式.它允 
许有 10 个循环项.可以参看命令 args(GetSsfStsm) 的输出.表 11-4 给出了该模 
型自变量的一个概要及其相应的符号.为了进一步说明，考虑 （11.1) 式和 （11.2) 式 
的局部趋势模型，这里令 < r e = 0. 4 , ％ = 0.2. 该模型是纯量不可观测项模型的一个 
特例.可以通过如下命令得到其状态空间形式. 

> ssf.stsm=GetSsfStsm(irregular=0.4,level=0.2) 

> saf.stsm 
$mPhi : 

【，1] 
tl,] 1 
[ 2 ,] 1 
SmOmega : 

[,1] 1,2} 

【 1 ,】 0.04 0.00 
【 2 ,】 0.00 0.16 
$mSigma : 

t,l] 

[1J -1 

【2,】 0 
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11.4 卡尔曼滤波和平滑 

本节将学习 (11.24) 式和 (11.25) 式中广义状态空间模型的卡尔曼滤波和各种 
T 滑方法.下面将按照 11.1 节里的步骤给出推导.对于只对应用感兴趣的读者，初 
次阅读时可以眺过此节.本节较好的一个参考书是 Durbin and K OO pm an ( 2 001, 第 
4章). 

11.4.1 卡尔 曼滤波 

重新回顾一下卡尔曼滤波的目的，即递归地得到在给定数据 F t = { Vl , lVt } 
条件下 St +1 的条件分布和模型.因为所涉及的条件分布是正态的，因此只要研究 
其条件均值和条件协方差矩阵就足够了.令力 h 和分别表示给定巧条件下， 
aj 的条件均值和条件协方差矩阵，也就是说 aj \ F t - NS #) .由 （11.24) 式 

〜 +i|* = E(rfe + T t at + RtJ} t \Ft) T t 8 t \ t , (11.53) 

S t+ i|t = Var(T f s t + RtV t \Ft) = + RtQtK (11.54) 

与 11.1 节相似，设 2/ t | t -i 表示给定巧 — 条件下 y t 的条件均值.由 (11.25) 式得 

Vt\t-l — 

令 

v t - y t - y t \ t -\ = !/t - (ct + = ^t( a t - +«*» (11.55) 

是的 在给定 F t _： 条件下 的向前 1 步预测误差.很明显有⑷ E ( Vt | F t _0 = 0; 
( b ) %和 F t _, 是独立的，即对于1 < Cov ( Vt , yi ) = 0;( c ) {v t } 是一列独立的 
正态随机向量.令= Vai ( vt | F t - i ) = Var { v t ) 是向前 1 步预测误差的协方差矩 
阵.由 （11.55) 式，可得 

Vt = Var[Z t (st — + ^t] = + 


(11.56) 
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因为巧= { F ,_ i , y £ } = 应用定理 11.1 可以得到 

8 t \ t =E(a t \F t ) = 

= EtstlFt - a ) 4- Cov ( a t , w t ) fVar ( w t )] -1 w t 
= (11.57) 
其中 = Cov ( s t , v t \F t -t) 由下式给出 

C* t = Cov(« t , Vil/t—i) = Cov[at, Zt(st — 占 t|t—l) 十 
=Cov[s f , Zf(« ( — «t|t_i)|F t _i] = 

因为 H , 是可逆的.所以这里假定 V , 是可逆的.利用 （11.53) 式和 （11.57) 式，我 
们得到 


= rft + ( 1 Vt — d，t -+ JKfVt , 


其中 


K t = T t C t Vi x = T t H t \ t _, Z ' t V ^\ 
是 < 时刻卡尔曼增益.利用定理 11.1(2), 有 


^ t\t = Var ( s t | F t _ i ) 

= Var(s t |F £ _i) - Cov(a f , u t )[Var(tJ ( )] x Cov(* t , v t y 
= ^ tlt - i - C t VT 1 C , t 

将 (11.60) 式代入 （11.54) 式，并利用 （11.59) 式，得到 


(11.58) 

(11.59) 


( 11 . 60 ) 


jXj + ( 11 . 61 ) 


将上述方程综合在一起，对于 （11.24) 式和 （11.25) 式所给出的状态空间模型，我们 
得到其著名的卡尔曼滤波.给定初始值《 1|() 和^ 1|0 ,卡尔曼滤波算法为 


vt = y t - ct - z ,8 t \ t - i , 

= ZtStft-i^t + 好《， 

K t = T t ^ t _ x Z ' t VT \ 

L t =T t -K t Z t , 

8 t+i\t = dt T t 8 t \ t _i -f K t v tl 

=T (E e | t _ i L[ + R t Q t JR! tl < = 1 ， … ， T. 


(11.62) 
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如果对滤波量和 S , | t 也感兴趣.我们将修正滤波使其同时包含滤波方程 
(11.57) 式和 （11.60) 式.这样得到的滤波算法为 

vt=Vt~ °t~ ^t 8 t\t-u 

V t = Z t E t ) t _ 1 Z ； + / f t = ZtCt + Ht , 

= + CtV ^ vt ， 

s t | t =s t | t _ 1 -c t vr 1 c；, 

= + RtQ t R[. 


稳定状态 

如果状态空间模型不随时间变化，即所有的系统矩阵也不随时间变化，则矩阵 
S . lt -! 收敛到常矩阵 S _， 而是矩阵方程 

E, = TH.T 1 - TY.,ZV~ X Z^T' ^ RQR\ 

的解，其中 V = ZJ 1 . Z ' + H . 收敛到后所得到的解称为卡尔曼滤波的穗定抉 
态解 ( steady-state solution ). 一■旦达到稳定状态解， V t , ，和 S t + I | t 就都是常数 ■ 
这在计算中能大大的节省时间. 

11.4.2 状态估计误差和预测误差 
状态预测误差定义为 


Xt = 8 t — « d | e - i - 

从上述定义知，； c t 的协方差矩阵为 VarCxtlFt-O - VarhliVi ) = 沿袭 11.1 

节的方法，我们可以推断 A 的性质.首先，由 (11.55) 式有 

Vt = Zt(at — +Ct = ZtXt + et. 

其次，由 （11.62) 式、 (11.24) 式以及前面的方程，得到 

* m = s t+i 一 s t + i\t 

= T t {at - + RtTJt — KtVt 

= TfXt 4" RfTjf — Ki^ZtXt + e ^) 

= LtXt + ft-tVt ~ ^t c ti 

其中.和前面一样， L , = r , - K t Z t 因此，我们可以得到 w 的状态空间形式 

v t = ZfflJt + c t , x t +\ = L t x t + RiVt ~ ^ e ti (11.63) 

其中 *i = «i — « i | o(t = 1，…， r ). 

最后，类似于 li . i 节的局部趋势模型，我们得到向前1步预测误差{的}彼此 
相互独立且 {Vtr - , V T } 和 Ft - y 相互 独立. 






11.4.3 状态平滑 
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状态平滑主要讨论给定外条件下〜的条件分布.值得注意的是 （ a ) 

和 {«.,••• , wt } 是独 立的； （ b ) « t 是序列独立的.对于给定 Ft 条件 下〜和 
, v T ] 的联合分布应用定理 11.1 可以得到 

*t|T = E(s t |Fr) = E(s t |F t _ 1 , - - - ,v T ) 

T 

= E^tl-Ft-i) + ^Cov(« t ,Vj)[Var(v t )] l v t 

J=t 

T 

= + Cov ( 的， v^V^Vt, (11.64) 

j=t 

其中，协方差矩阵是 给定朽 条件下的条件协方差矩阵.目对干…，7\协 
方差矩阵 Cov ( s t , vj ) 可以如下推出•由 (11.63) 式有 

Cov ( a t ， Vj ) = E —;) 

= -|- Cj) r ] = K(8tXj)Zjj j = t,' y T. (11.65) 

此外还有 

= Var(a t ) = E 中 _!， 

E(«tx^j) = E[a t (LtXt + RtVt ~ ^t^tY] = 

E(*<*7') = - - - L' t _ x . (11.66) 

将上面两个公式代入 （ 11.64) 式，对于 t = 7 1 - 2, r - 3, ... ， 1 ，有 

S T|T — ®T|T-1 + T-\^T^ r T X ' v Ti 

s T-l|r = a T-l\T-2 4- ^T\T-\^T-]yT-i V T-\ + ^T\T-lL > T_iZ ， T V^ i VT 1 
S *|T = a t\t-\ + l w t + 'E t \ t ^iL[Z > t+l V^ ： l vt+i 

+ ... + - - • L , t _ x Z , t V^}vti 

这里，当 t = 了时有 I/ t = = J m . 这些平滑状态向量可以表示为 

° t\T = + 刃川-1%-1， (11.07) 

其中 Qt-i = t^ v t^ Qt--2 = + 且 

9t-i = 十 Z ; e+1 VVt+1 + … + Ir:Z4 +1 … L , t _ 1 Z , t V t 1 Vt, 
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(t = T -2, T -3,--, l ). q t - i 是发生在时刻 t - 1 后的向前 1 步预测误差％的加 
权和.由前面方程的定义知，&可以通过下述向后递归得到 

q t -i = ^[ V^vt + L \ q u < = T ,- ,1, (11.68) 

其中= 0. 联立这些方程，我们得到平滑状态向量的向后递归 

Qt-i = Z[V^ l Vt 4- L[q t , 8 t \r = 4 - 53t|t_iQ, i, t = T, ••- , 1, (11.69) 

该递归从 q T = 0 开始，而且 Sqm 和可通过卡尔曼滤波得到.在 
相关文献里这就是固定区间平滑 (fixed interal smoother). 参见 de Jong(1989) 和其 
屮的参考文献. 

平漘状态向量的协方差矩阵 

下面，我们将推导出平滑状态向暈的协方差矩阵.对于给定条件下和 
{ v t .--, v T } 的条件联合分布应用定理 11.1(4), 得到 
T 

Stir = - Cov(« t ,«j)[Var(t; i )]~ 1 [Cov(s i , w J )] / . 

3 =t 

由 （11.65) 式和 (11.66) 式里的协方差矩阵.进一步可得到 
—• •. — - - - L > T _ l Z , T V ^< 1 ZtLt-i • - - 

其中 

Mt-x = Z' t V ： l Z t + KZ^V^Z^Lt 

+ • • • + … L' t _ j 1 ZtLt- \ • • • Lt. 

当尤二了时仍然有以…砧^二/阶由该定义矩阵 M t _ i 满足 

M ( _ x = Z , t VT l Z t + L \ M t L u t = T r - ,1, (11.70) 

且初值为 = 0. 综合前面的结果，我们得到计算 E t | T 的向后递归公式 

^ 1-1 — t + L[MtLt, Seix = — (11.71) 

其中 <=7\... ,1 且 /VfT =0. 注意正如 11.1 节里的局部趋势模型， M t - Var( 9t ). 
联合上面平滑状态向量的两个向后递归公式，我们有 

Qt - l = Z ' t Vt l v t + L ^, 

®e|r = ^e|t-i + ^t\t-\Qq-u 

L[M t L u 

S t |p = S t | t _i — t = T",... ， 1, 


(11.72) 
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其中 q T = 0 H . M t = 0. 

假定 (11.24) 式和 （11.25) 式里的状态空间模型已知，则卡尔曼滤波和状态平 
滑可以通过两步运算得到.首先，对于 * = 1，...，7\使用 (11.62) 式里的卡尔曼滤 
波并获得量 V ,，吖 h 和其次，对于 i = T , …，1，应用（ II . 72 )式 
的状态平滑法得到和 E t|i . 

11.4.4 扰动平滑 

令 e t|T = E ( et | Fr ) 和仏 | T = E ^ tlFr ) 分别表示观测方程和转移方程的平滑 
扰动. 这些平 滑扰动 (smoothed disturbances) 在许多应用领域（比如在模型检验中） 
都很有用.在本小节，我们将学习计算平滑扰动及其协方差矩阵的递归算法.再次 
对于给定条件下 e < 和 { u t ，… , v T } 的条件联合分布应用定理 11.1 : 得到 

T 

^t\T = - - - ,vt) = 

这里用到了 0 = 0. 利用 (11.63) 式有 

E ㈣ ) = E ( e t x ；) Z ；. + E ( e f e ；). 

由于 E ( c * x {) = 0,从而有 

E(e t v f j )={ Ht ' , 若 J = *， 

反复应用 （11.63) 式以及 { e t } 和 {77 J 之间的独立性，我们得到 

E(0 -H t K t , 

E« 2 ) = -H t K t L t+l1 


E>(etx r T ) = —HiK^L 1 ^ - - - Lh 
其中当 i = r - 1 时，有 L ； +1 -. L' t _ x = / m .基于 （11.74) 式和 （11.75) 式，得到 

«e|T = HtiV^vt- K^Z^V^vt+i - - ^ L^Z^V^vt) 

= H t { Vl l v t - K \ q t ) — H t o u i = T ,*-- ,1, (11.76) 

其中％ 由 （11.6 7 ) 式定义且 = V ~ x v t - K [ q t . 我们将 0 , 称 为平滑测量误 
差 (smoothing measurement error). 

平滑扰动可用类似的方式推导出，即 


(11.73) 


(11.74) 


(11.75) 


Vt\T = =y Z^ E ^U v ， i) v J lv r 


(11.77) 
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(11.67) 式的状态空间模型给出 

J l 若：; = t + 2，".， r , 

其中，对于 *=1, …， 7\ 有 

El 刀 tM+a) = 

E ( T 7 i ® l + 3) = Q /- Rii / + iXj +2 » 


E(tj t xJp) = Q t R[L[ +l - • - L r T _^ t 

因此， (11.77) 式意味着 

” t|r + ^ , <+ l '^ e +2^ r H - l 2 v t +2 

+ ... + L[ +l - - • Ly_ 1 ZrVp 1 t>r) 

- Qt ^ qt ， i = r , • •. , 1, (11.78) 

其中％由先前的 (11.68) 式所定义. 

Koopman (1993) 利用平滑扰动 r ; <| T 椎导出一个 计算％ T 的新的递归方法.由 
(11.24) 式的转移方程，有 

a <+ i|r = + T t 8 t \ T - f - HfT 7 t | T . 

利用 (11.78) 式可得 

fit 1 1\T = di 4- r t s tlT + RtQtR!^, * = 1,. . . ， T ， （ 11.79) 

其中初始值为 s 1|r = ^ no - f - Enogo 且办从 (11.68) 式的递归方程中得到. 

平滑扰动的协方差矩阵 

平滑扰动的协方差矩阵同样也可以通过定理 11.1 得到，具体地 
Var(e t |Fr) = Var(ej!|F*_i ,v t , - - - ,vr) 

T 

= Var ( e t | F t _ i ) - ^ Cov ( e t , w _,) V ~ l [ Cov ( e t , v i )] / . 
j=t 

注意 （11.74) 式给出 Cov ( e ( , Wj ) = E ( e < v ；), 因此我们有 

Varktli^r) = H t - H t (V「 l + K^Z^V^Z^Kt 
+ K' t L' t ^Z' t+ 2 V^ 2 Z t+ 2 L t+ 1 K t 
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4 - …+ K ' t L[ + i • - - Lrp _ l Z ' T V T l Z tLt-i • • • Lt + if ^ t)Ht 
= H t - 坧 (Vr 1 + K[M t K t )H t 
= H t -H t N t H t , 


其中 = Vr 1 + K'fMtK ,, 这里的由 (11.70) 式给出.类似地 

T 

Var(77 t |F T ) = Var(77 t ) - ^ Cov^^vOVr^Cov^, v t )] _1 , 

i =« 

其中 Cov ( i 7 t , i ^) = E ( r ^ t ^) 在推导 r / t | T 的公式时已经给出.因此 

Va4-(T/ t |Fr) = Q, - Q t H!,(Zt+ 1Z t+ 1 -t- L , t ^ l Zt+2V^. 2 ^f+2^ / t^i 
+ … + L[ +1 • - - L' T _ i Z' T V^- 1 ZtLt-x - • - L t ^.\)R t Q t 
=Q t -Q t R! t MtR t Q t . 


总之,扰动平滑算法如下 


e t{T = H t ( Vr l v t - K [ q t ), 

r 1t\T = Qf-^lQt^ 

Qt i = Z , t Vt l v i + L[q t , 

Var(e t |F r ) = H t - ^(V ^ 1 + 

Var (7 7 t | F T ) = g t - Q t R [ M t R t Q t . 

M l - i - Z , t V ~ ] Z l + L , t M t L l , ,1, 

其中 = ◦ 且 — 0. 


(11.80) 


11.5 缺失值 

对于 (11.24) 式和 （U.25) 式中的广义状态空间模型，我们考虑缺失值的两种 
形式.首先，类似于 11.1 节中的局部趋势模型，假设在时刻 t = f + l，". ，€+办 的 
观测值 y t 是缺失的.此种情况下,在这些时间点上，没有新的信息.我们令 

vt = 0, K t = 0, for t = < + l, … ，《十 ft. 

这时和平常一样就可以运用 (11.62) 式中的卡尔曼滤波.也就是 

a t+i|t = di + 23t+i|t = ^23(|£_|2^ + RtQtHft ， 

这里 f =^+1,.- ,£ + h. 类似地，对于 t = £+l,“. J + 平滑状态向最也可以像 
往常一样通过 (11.72) 式计算如下 


Qt-i = r， t9fi Mt-i = T t M t T t , 
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在第二种情形，部分缺失.设 W = Jy t 为 t 时刻所观测到的数据向量，这里 
J 为识别观测数据的指示矩阵.更具体地讲，•/的行是 fc x A ： 单位矩阵的子集.此 
时，模型的观测方程 (11.25) 式可以转换为 

s/r = < 十 e ?5 

其中 c : = Jet , Z \ = JZt 和 e ? = Jet , 目.协方差矩阵 V «) = H ； = JH t J ' 
了时刻 f 使用修正的观测方程外，可以继续应用卡尔曼滤波和状态平滑递归.因此, 
状态空间模型的一个好的特点就是便于处理缺失值. 

11.6 预 测 

假定预测原点是 f 且我们关注2/,+,的预测值 ， j = l ,--., h , h >0 . 我们仍然 
采用最小均方误差预测.类似于 ARMA 模型，向前 j 步预测误差 y t (j) 就是给定 
F t 条件下的条件期望值.也就是说， y t (j) = E(y t+j \F t ). 下面，我们将证明这 
些预测和相应的预测误差的方差可以通过 (11.62) 式中的卡尔曼滤波得到，只是此 
时将 { y t+ ir - , y t + h ) 看作缺失值，这正是 11.5 节的第种情形. 

考虑向前 1 步预测误差.由 （ 11.25) 式 

1/“1) = E{y y nl-Ft) = Ct+i 4- 

其中可以通过预测原点为 t 时刻的卡尔曼滤波得到.相应的预测误差为 
e t ( l ) = y t+l - y t (l) = Z t + x (« t + i - 〜+ i | t ) 十 e £+l . 

因此，向前 1 步预测误差的协方差矩阵为 

Var [ et ( l )] = Zt + iJjt -\- i \ t ^ t+i + 丑 t + i . 

这正是 (11.62) 式中卡尔曼滤波的协方差矩阵 V t + i , 于是，我们证明了 1 的情 

形.对于 h>l, 我们按顺序考虑 1 步到/ I 步的向前预测.由 （ 11.25) 式，向前 j 步 
预测为 

VtU) = + (11.81) 

且相应的预测误差是 

e t ( j ) = ~ 8 t -\- j \ t ) + Q + j -. 

值得注意的是， 《 t + 川和分别是给定6条件下〜的条件均值和条件协方 
差矩阵.上式说明 

Varfee^')] = 十 (11.82) 




进一步，由 (11.24) 式 
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这反过来意味着 

办 +i+i 一 = T« + j(ae-fj — «<+i|t) + Rt+jfJt i y 

因此 

(11.83) 

值得注意的是， Var [ e t ( j ')] = V t+3 且对于 *+ J *， 卜 1, …， h , (11.81) 〜 (11.83) 
式是由 (11.62) 式给出的卡尔曼滤波的递归公式，且此时 v i+j = 0, K t+j = 0.因 
此，预测值 y t { j ) 和其预测误差 e t ( j ) 的协方差矩阵都可以通过带有缺失值的 f ： 尔 
曼滤波得到. 

最后，可以利用误差预测序列来计算估计时用到的似然函数且标准化的 
误差预测 D「 1/3 / 卟可以用米进行模型检验，这里认 =diag{V t (l ， l) ， … ,V t (fc,A:)} 
且是 V t 的第 （ M ) 个元素. 


11.7 应 用 

在本节中，我们考虑状态空间模型在金融和商业中的一些应用.我们的目标是 
突出模型的应用且演示 S-Plus 中用 SsfPack 进行分析的实际操作. 

例 11.2 考虑 General Motors(GM) 股票从1990年1月到2003年12月的月简 
单超额收益率的 CAPM. 参见第9章.我们将 S&P 500复合指数的月简单超额收 
益率作为市场收益率.我们从简单市场模型开始 

r t = a + + e H , e. t ~ AT(0,^) (11.84) 

i=l,-,168. 这是一个确定系数的模型，很容易通过普通最小二乘方法 （OLS) 来 
估 W . 分别用 gm 和 8 p 来表不 GM 股票收益和市场收益，结果如下给出. 

> fit=0LS(gm-sp) 

> summary(fit) 

Call: 

OLS(formula « gm - sp) 

Coefficients : 

Value Std. Error t value Pr(>|t|) 

(Intercept) 0.0020 0.0063 0.3151 0.7531 

sp 1.0457 0.1453 7.1964 0,0000 

Regression Diagnostics : 

R-Squared 0.238 

Adjusted R-Squared 0.233 

Durbin-Watoon Stat 2.029 

Residual Diagnostics : 

Stat P-value 
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Jarque-Bera 2.537 0.281 

Ljung-Box 24.207 0.117 

Residual standard error : 0.0813 

因此，所拟合的模型为 

vt = 0.02 + 1.045 +e“ a t — 0.081 3. 

基于残差诊断,模型对于 GM 股票的收益似乎是充分的且有修正后的炉= 23.3%. 

正如 11.3 节，模型 (11.84) 式是状态空间模型的一个特例.我们利用 SsfPack 
来估计该模型.结果 如下： 

> reg,n\=function(parm,raX=NULL) { 

+ parm=exp(parm) % log(sigma.e) used to ensure positiveness. 

十 ssf♦reg^GetSsIReg(mX) 

+ ssf - reg$mOmega [ 叉 ， 2]=parm[l] 

+ CheckSsf(ssf.reg) 

♦ } 

> c.st<irt=c (0.1) 

> reg. f it*Ssf Fit (c. start, gm, "reg• m" , mX=X.mtx) 

RELATIVE FUNCTION CONVERGENCE 

> sqrt(exp(reg.fit$parameters)) 

[1 】 0.00129934 

> 

% Next, perform smoothing 

> ssf.reg$mOmega[3,3]=exp(reg.fit$parameters) 

> reg•s-SsfMomentEsr(gm,ssf.reg,task- w STSMO M ) 

> reg.s$state.moment[10,] % use 10th row to avoid impact 

state.1 state.2 % of the starting value. 

【 10, J 0.001985928 1.045712 

% Next, obtain standard errors of eotimateo 

> sqrt(reg.s$state.variance 【 10 ,】 ） 

state.1 8tate.2 
0-006301927 0.1453096 

如所料想，整体上该结果和 OLS 方法所得出的一致. 

最后，我们采用 11.3.1 节的时变 CAPM . 下面给出了估计的结果，包括平滑响 
应变量的时 间图. 利用命令 SsfCcrndDens 计算状态向量和观测的不带方差估计的 
平滑估计. 

> tv.capm * function(parm,mX=NULL){ % Setup the model 

+ parni=exp (parm) %parameterize in log for positiveness. 

+ Phi.t * rbind(diag(2),rep(0,2)> 

+ Omega=diag(parm) 

+ JPhi=matrix(-1,3,2) 

+ JPhi C3,1] -1 
+ JPhit3 ( 2]=2 
+ Sigma*-Phi.t 
+ ssf.cv=list(mPhi=Phi.t, 

+ mOmega=Omega, 
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+ mJPhi*JPhi # 

+ mSigma=Sicfma , 
+ mx=mx) 


♦ CheckSsf(ssf.tv) 


> tv.start=c(0,0 # 0) %starting values 

> tv ,rale*SafFi t(tv.ataxt,gm # M tv.capm w ,mX 
.mle=sqrt(exp(tv.mle$parameters)) 
.mle 

.168806e-05 0.0037428207 0.08129916 


: X.mtx) 


sigma .i 
sigma .i 


%estimation 


% Smoothing 

> smoEst.tv^SsfCondDens(gm,tv.capm(tv.mle$parameters, 
+ mX=X.mtx),task="STSMO") 

> names(smoEst•tv) 

[1] ” state" "response" "task" 

> par(mfcol»c(2,2)) %plottinq 

> plot(gm,type? 1， excess return 1 ) 

> title(raain« # (a) Monthly simple excess returns # ) 

> plot(emoEst.tv$response,type= # 1 # ,ylab 篇 , rtn # ) 

> title(main= # (b) Expected returns # ) 

> plot(smoEst.tv$state[ # 1],type= # 1 # ,ylab=^value，} 

> title (main=» # (c) Alpha (t) 9 ) 

> plot(smoEst.tv$etate [,2] t type- # # ylab- # value # ) 

> title(main= # (d) Beta(t) # ) 


汴意，％ 和〜 分别为 1.17 x 10- 5 和 0.74 x 10- 3 . 这些估计和 0 非常接近，表明 
对于 GM 股票的收益率而言时变市场模型中的 和负 木质上是常数.这与确 
定系数的市场模型能很好地拟合数据这个事实是一致的.图 11-5 给出了有关时变 
CAPM 的一些图 • （a) 是从 1990 年 1 月到 2003 年 12 月的 GM 股票月简单超额收 
益率的时间图 . （b) 是 GM 股票的期望收益，即 r t , r , 其中 r = 1(38 是样本容量 . （c) 
和 （d) 分别是…和 決 估计的时间图.对于给定的刻度紧密的纵轴，这两个时间图 
均证实了确定系数的市场模型对于 GM 股票的月收益率是充分的. 

例 11.3 在本例中，我们利用不可观测的成分模型重新分析 Johnson 股票的季度 
收益序列，时间区间是从1960年到1980年.数据的细节參见第2章.考虑的模 
型为 


yt = ^ + Tt + et, e< 〜 N(0, a^), (11.85) 


其中讲是观测到的每股收益的对数 . 为局部趋势项且满足 


沟+1 = ptt + Vtt Vt 〜 

且是季节项且满足 

B -\- B 2 + B 3 )7t = wc, a；t ~ ^V(0, o^), 

也就是说 7 t = - E it-i + 吣.此模型有三个参数〜，％和这是一个简单的 

i=l 
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不可观测成分模型.该模型的状态空间形式为 

' fH+1 1 「1 0 0 0 "1 r ^ 1 [10 

7t+i _ 0-1—1 — 1 + ° 1 f 叫 

7 t 0 1 0 0 7 t-i 0 0 W ， 

7t_i J [ 0 0 1 0 J [ %_2 」 [ 0 0 

其中，的协方差矩阵是 K ，^>, -Eye = [ l ， l ，0,0]* t + e t . 参见 ll . 3 节•其 
实这是 SsfPack 中结构时间序列的特例且很容易利用命令 GetSsfStsm 给出.进行 
最大似然估计，我们得到= (0.014 3,0.269 6,0.171 2). 


(c) 



图 11-5 将时变 CAPM 应用于 GM 股票的月简申超额收益宇时一些统计量的时间图. S&P 
500复合指数的月简单超额收益率作为市场收益率， （ a ) 月简单超额收 益率； （b) 超 
额收益 r t |r； (c) a# 的估计； （d) A 的估计 


> jnj=scan(file= , q-jnj.txt*) 

> y-log(jnj) 

% Estimation 

> jnj.ra=function(parm){ 
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【 1] 4 

attr( , "class"): 

【 1 】 M ssf n %below ： smoothed components 

> jnj - smo=SsfMomentEst(y,jnj.ssf,task= M STSMO") 

> upl=jnj.smo$state.moment 【 ， 1】 + 

+ 2*sqrt(jnj.smo$state.variance L 1 】 ） 

> lwl=jnj.smo$state.moment 【， 1] - 

+ 2*sqrt(jnj.smo$state.variance[,1]) 

> max(upl) %obtain range for plotting 
[1] 3.067664 

> rain(lwl) 

[1] -1.063997 

> up=jnj.smo$state.moment[ # 2] + 

+ 2*sqrt(jnj.smo$state.variance[ # 2]) 

> lw=jnj.smo$state.moment [,2] • 

+ 2*sqrt(jnj•smo$state.variance 【， 2]} 

> max(up) 

[1] 0.5909587 

> min(lw) 

[1] -0.6157968 

> par(mfcol«c(2 # l)) %plotting 

> plot(tdx,jnj.omo$etate.moment[,1] # type- 9 1 9 ,xlab-'year ’， 

+ ylab= # value # # ylim»c(-1.1,3.1)) 

> lines (tdx # upl # 1 ty=»2) 

> 丄 ines(tdx,lwl,lty=2} 

> title(main= # (a) Trend component # ) 

> plot(tdx,jnj.smo$state.moment [,2】 # type= # 1 # f xlab= # year # , 

+ ylab= ， value ，， ylim=c(-.62,0.6)) 

> lines(tdx,up,lty-2) 

> lines(tdx,lw r lty=2) 

> title(main® 1 (b) Seasonal component # ) 

% Filtering and smoothing 

> jnj•fil=KalmanFilly^jnj.ssf # task= M STFIL M ) 

> jnj.smo-KalmanSmo<jnj.fil,jnj.ssf) 

> plot (tdx, jnj . f il$n\Out [ r 1] # type= # 1 # # xlab= # year # , 

+ ylab= # resi") 

> title(main= r (a) 1-Step forecast error r ) 

> plot(tdx,jnj•smo$response.residuals [2 :85 】 ， type= # 1 # # 

+ xlah= # year 1 # ylab« # resi 1 ) 

> title(main= # (b) Smoothing residual # ) 

图 11-6 给出了趋势项和季节项的平滑估计，即仏 |7 • 和 7«|7* 且 r s 84 . 令人感 
兴趣的是季节项似乎随时间变化 . 图中还给出了不可观测项的置信水 T 为 95 %的 
逐点置信区间 . 图 11-7 给出了残差图 . 其中 （ a) 给出了利用 P 尔曼滤波汁算的向 
前 1 少预测误差而 （ b) 为拟合模型的平滑响应残差.因此状态空间模型给出了另 
外一种选择来分析季节时间序列 . 必须说明的是图 11-6 给出的估计项并不是唯一 
的 . 它们依赖于指定的模型和选用的参数 . 实际上，将可观测日、 j 间序列分解成不可 
观测项的方法有很多 . 例如，对于季节项可以指定不同的模型，比如，利用 6’s//^cfc 




中的 BeasonalTrig 来得到 Johnson 和 Johnson 公司收益序列的另一种分解因此， 
在解释被估项时要特别的小心 . 然而，如果出子预测的目的，只要选抻的分解方式 
正确，对于分解方式的选择并不重要 • 



图 11-6 给 Johnson 股票的对数季度收益序列所拟合模型 （11.85) 式的平滑项，时间区间是 
从1960年到1980年： （ a ) 趋 势项； （ b ) 季 节项. 点线为置信水平为95%的逐点置 
信区间 



图 11-7 给 Johnson 股票的对数季度收益序列所拟合模型 （11.85) 式的残差序列： （ a ) 向前 
I 步预测误差讲； （ b ) 响应变量的平滑残差 

练习题 


11.1 考虑 ARMA (1,1) 模型 - Q . Sut-r = a ,+0.4 o t _ 1 ，其中 a » 〜 "(0,0.49) 的.分别利用 
( a ) Akaike 方法； （ b ) Harvey 方法； （ c ) Aoki 方法将该模型转化成状态空间 形式. 
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11.2 文件 aa - rv -20 m . txt 包含了 Alcoa 股票收益序列从 2 003年1月2日到 2 007年5月7 
曰的日己实现波动率.参见 11.1 节的例子.波动率序列由每日内间隔20分钟的对数收益 
计算. 

( a ) 给对数波动率序列拟合一个 ARMA (0，1,1) 模型并写出该模型. 

(b) 对于对数波动率序列估计 (11.1) 式和 (11.2) 式的局部趋势模型.参数和〜的 
估计是什么？给出滤波和平滑状态变量的时间图和置信水平为95%的逐点置信区间 
图. 

11.3 考虑 Pfizer 股票和 S&P 500复合指数的月简单超额收益率，时间区间是从1990年1月 
到2003年12月.超额收益串包含在文件 m - pfeap - exSOOa . Uxt 巾，且第一列为 Pfizer 
股票收益皁. 

( a ) 给 Pfizer 股票收益率拟合一个确定系数的市场模型并写出该棋型 

( b ) 给 Pfizer 股票收益拍合一个时变的 CAPM . …和冰序列中新息的被估标准误差是 
多少？给出…和汰的平滑估计的时间图 • 

11.4 考虑 AR (3) 模型 

xt = <f>iXt-x + 02Xt-a + <(>3Xt-3 + at, a* 〜 N{0, 

且假设观测数据是 

yt = xt + c t , e t ~ iV (0, ( Tg ), 

其中 { e t } 和 { a t } 独立且 Tj(j ^ 0) 的初始值和 > 0) 与 > 0) 是独立的. 

( a ) 将该模瑣转化成状态空间形式. 

(b) 如果 E ( e t ) = c , 且不为0,则系统相应的状态空间形式是什么？ 

11.5 文件 m - ppiaco . txt 包含了年，月，日和 U . S . 制造业价格指数 ( PPI ), 时间区间是从1947 
年1月到2004年的8月.该指数针对所有的日用品且没有经过季节调整.设 A = 
— In (石- 0，其中 Z t 是观测到的月 PPI . 如果忽略极小的季节依赖性，则 AR (3) 
模型对于似乎是充分的•令讲表示样本均值修正后的 A 序列 • 

( a ) 给讲 拟合一个 AR (3) 模型并写出该模型 • 

(b) 假设扒 有独立的测量误差且 y t = + e t ， 其中 x , 是一个 AR (3) 过程且 Var ( e t ) = 

a \. 利用状态空间形式去估计参数，包括状态新息的方差和 d 写出拟合的模型并 
给出平滑估计的时 间图. 另外，给出所拟合状态空间模型的滤波反应残差的时间 
图. 


参考文献 





Durbin, J. and Koopmaii* S. J. (2001). Time Series Analysts by State Space Methods. Oxford 
University Press, Oxford, UK. 

Hamilton ， 丄 （ 1994). Time Senes Analysis. Princeton Uni verm ty Press, Princeton, NJ. 

Harvey, A. C. (1093). Time Scries Models, 2nd edition. Harvester Wheatsheaf, Hemel Hempstead, 
UK. 

Kalman, R. E. (I960). A new approach to linear filtering and prediction problems. Journal of 
Basic EngineeHng, Transactions ASM A Series D 82: 35-45. 





第 12 章马尔可夫链蒙特卡罗方法及其应用 

计算工具与计算方法的进步已经大大地增强了我们解决复杂问题的能力.这 
种进步也扩展了许多已有计量经济方法和统计方法的应用统计中这种进步的例 
子包括马尔可夫链蒙特卡罗方法 （ MCMC ) 和数据扩展.有了这些方法，我们便能够 
进行一些几年前还不可行的统计推断.本章引进了金融中广泛使用的 MCMC 方 
法和数据扩张的思想.特别地，我们讨论经由 Gibbs 抽样的贝叶斯推断，并演示了 
MCMC 方法的各种 应用. MCMC 方法论的迅速发展不可能涵盖所有在文献中出 
现的新 力法. 感兴趣的读者可以参考一些近期的关于贝叶斯统汁和实证贝叶斯统 
计的书（例如 Carlin and Louis , 2000; Gelman , Carlin , Stern and Rubin , 2003). 

对于应用，我们把注意力放在与金融计量经济学有关的问题上.本章中所表述 
的仅仅是此方法在金融中所有可能应用中的一小部分 • 事实上，公正地说，我们这 
里讨论的贝叶斯推断和 MCMC 方法在金融计量经济学的大多数研究（如果不是全 
部的话）中，都是切实可行的. 

首先回顾一下 马尔可夫过程 (Markov process ) 的概念.考虑一个随机过程 { X t }, 
这里假定每个不都在空间0上 取值. 称过程 { X t } 是一个马尔可夫过程，如果它 
具有 性质：给定不 的值. X h [h > t) 的值不依赖于 X 9 {s < t) 的 取值. 换句话说，称 
{Xt) 是一个马尔可夫过程，如果它的条件分布函数满足 

P(X h \X a ,s^ t)^P(X h \Xt) y h>t. 

如果 { X ( } 是一个离散时间的随机过程，则前面的性质变为 

P(X h \X {y X t -ir-) ^ P(X h \X t ), h>t. 

令 A 表示 e 的子集,则函数 

r t (0,h.A) = P(X h e A\Xt = 9), h>t 

称为马尔可夫过程的转移概率函数.如果转移概率依赖于 h-t, 但是不依赖于<， 
则过程有一个平稳的转移分布. 

12.1 马尔可夫链模拟 

考虑参数向量为0和数据为久的推断问题，其中0 e ©• 为了做出推断，我 
们需要知道分布 P(o\x). 马尔可夫链模拟的思想是在 e 上模拟一个马尔可夫过 
程，它收敛于平稳转移分布 P{0\X). 
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马尔可夫链模拟的关键是构造一个具有指定的平稳转移分布 P(0\x) 的马尔 
可夫过程，并且充分长地运行这个模拟.使得过程当前值的分布与平稳转移分布足 
够 接近. 对给定的 P( 0 \X), 可以证明能够构造许多具有所需性质的马尔可夫链.我 
们将利用马尔可夫链模拟来得到分布 P{B\X) 的方法称为 MCMC 方法. 

在统计文献中， MCMC 方法以各种各样的形式 发展. 考虑数据分析中的“缺失 
值”问题.本书中讨论的统计方法都是在“完全数据，，(即没有缺 失值） 的假定下发 
展的例如，在给资产收益率的日波动率建模时，我们假定样本期间内的收益率数 
据在所有交易日都可以 得到. 如果存在一个缺失值，那我们应该怎么办呢？ 

Dempster , Laird 和 Rubin (1977) 提出个称为 EM 算法的迭代方法来解决这 
个问题.这个方法包含两个步骤.第个步骤，如果缺失值可以得到，则我们能够利 
用完全数据分析的方法来建立-个波动率模型.第二个步骤，给定可以利用的数据 
及拟合的模型，我们能够推导出缺失值的统计 分介. 填允缺失值的一个简单方法是 
利用缺失值的导出分布的条件期望.在实际中，可以用缺失值的一个任意值来开始 
这个方法，且迭代足够多的次数直到 收敛. 前面方法中的第一个步骤涉及对一个指 
定的模型进行最大似然估计，称为 M 步. 第二个步骤是计算缺失值的条件期望称 
为 E 步. 

Tanner 和 Wong (1987) 以两种方式扩展了 EM 算法. 首先，他们引进了迭代 
模拟的思想.例如，可以简单地利用从缺失值的导出条件分布里抽取的一个随机数 
来代替缺失值.而不是用条件期望来代替.其次，他们利用数据扩张的概念扩展了 
EM 算法的应用.数据扩张意味着在所研究的问题中加入一个辅助变量.可以证明 
许多的模拟方法通常可以通过数据扩张来简单化或加速.参见本章的最后一节 

12.2 Gibbs 抽样 

Geman 和 Genian 夫人 (1984) 以及 Gdfand 和 Smith ( l "0) 的 Gibbs 抽样(或 
Gibbs 样本）可能是最流行的 MCMC 方法.我们通过一个带三个参数的简单问题 
来引进 Gibbs 抽样的 思想. 这里所用的单词“参数”的意义非常广泛.在 MCMC 框 
架下，—个缺失的数据点就可以当作一个参数.类似地，一个不可观测的变量如资 
产的“真实”价格，在有 yv 个交易价格可以得到的情况下，也可以认为是 at 个参 
数.•‘参数”这个概念与数据扩张是联系在一起的.这在我们讨论 MCMC 方法的应 
用时将会变得很清楚. 

将个参数分别表示 为仏， ^和 化.令 X 表示可用的数据集， M 表不釆用 
的模型这里的目标是估计这些参数以便利用拟合的模型做山推断.假定模型的似 
然函数很难得到，但是在给定其他两个参数的条件下，单个参数的条件分布是可以 
得到的.换句话说.我们假定己知下面的三个条件 分布： 

fi(0i\e 2 ,e 3: x,M), M62\o 3l e u x > M) 1 Mo^\e x ,d 2 ,x,M), ( 12 . 1 ) 
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其中表示给定数据、模型以及其他两个参数的条件下，参数仏的 
条件分布.应用中.我们不需要知道条件分布的精确形式.需要的是从三个条件分 
布的每一个中抽取随机数的能力 • 

令和心，0是&和^的两个任意的初始值，则 fiihhs 柚样如下 进行： 

⑴从 / l («1^2,0^3,0, X , M ) 中抽取一个随机样木，并将抽取的随机数记为仏,1: 

(2) 从中抽取一个随机样木，并将抽取的随机数记为心,1 

(3) 从 / 3 { 03 \ 0 i , i , 0 2 ,\, X , M ) 中抽取一个随机样本，并将抽取的随机数记为知 ,1 
这就完成了_次 Gibba 迭代，且参数变为01, 1 ， 02,1和沒 3,1. 

下一步，利用新参数作为初始值，重复前面随机抽取的迭代，我们可以完成另 
—次 Gibbs 迭代，并得到更新的参数 <91,2, 02.2 和 03,2. 我们可以重复前面的迭代 m 
次，得到一系列的随机 抽取： 

(设1.1， ftu ，沒3,1)，…，(没 l . m ，02， m ， 沒 3， m ). 

在一些正则性条件下，可以证明对一个充分大的 m , U ' mD 渐近等价子来 
自于三个参数的联合分布 f { e 1 , d 2 , d 3 \ x , M ) 的一个随机 抽取. 正则性条件是弱的 • 
它们本质上是要求对一个任意的初始值(»1,0, 02,0^3,0), 前述的 Gibbs 迭代有机会 
访问整个参数空间.真实的收敛定理涉及到利用马尔可夫链的理论.参见 Tierney 
(1994). 

实际中，我们利用一个充分大的％并且丢掉 Gibbs 迭代的前 m 个随机抽取 • 
来建立一个 Gibbs 样本，即 

(设 l , m 十 1，设 2. m 十 1，没 3, m 十 1)，…> ^2, a ,^3, n ) (12.2) 

因为前面的迭代建立了—个来自联合分布 m , e 2 , e 3 \ x , M ) 的随机样本，所以可 
以利用它们来做出统计推断.例如，氏的一个点估计及其方差为 

9i = — - — 51 氏 J ， ^? = - ~ ^ ■— 7 S (氏，广良) 2 . ( 123 ) 

(12.2) 式中的 Gibbs 样本可以有许多种使用方法.例如，如果对于检验原假设 
Ho ： 01 - 9 2 对备择假设 H a - 9 ,^ <9 2 感兴趣，则可以简单地得到0 = - 02的点 

估计与其方差为 

j = m+l j = m+l 

则原假设可以利用传统的 <- 比统计量 < =彡作来检验 • 

注释1: Gibbs 抽样中被丢掉的前 m 个随机抽取通常称为预烧 （ burn - in ) 样 
本.预烧样本用来保证 （ 12 . 2 ) 式中的 Gibbs 样本确实与来自联合分布 f ( ei , e 2 , e 3 \ x , 
M ) 中的随机样本足够接近. □ 
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注释2: 前面讨论的方法包含了运行单个长链并在预烧后保留所有随机抽取 
得 到一个 Gibbs 样本.另一种方法是利用不同的初始值和一个相对小的 n 运行许 
多相对短的链.在每条链中，最后一次 Gibbs 迭代的随机抽取都可以用来建 立一个 
Gibbs 样本. 口 

由前而的介绍， Gibbs 抽样具有这样一个优点，即将一个高维的估计问题利用 
所有参数的条件分布分解为几个较低维数的问题.极端地，一个具有 n 个参数的 
髙维问题可以通过利用災个1维的条件分布迭代地解决.这个性质使得 Gibbs 
抽样非常简单且广泛应用.然而，将所有的随机抽取都简化为]维问题通常不是 
有效的.当参数高度相关时.值得将它们联合地抽取.作为说明，考虑三个参数的 
例子.如果 ^和内 是髙度相关的，则可以在任何可能的情况下，釆用条件分布 
/( 札内 |<? 3 ， X ， M ) 和 M 6 3 \ d u e 2 , X , M ). 这时一次 Gibbs 迭代 包含： 

( a ) 给定 h 的条件下联合抽取 （的為)； 

( b ) 给定 { e r , e 2 ) 的条件下抽取 0 3 . 

关于参数相关性对 Gibbs 抽样收敛速度的影响，更多的信息可以参见 Liu , Wong 和 
Kong (1994). 

在实际中， Gibbs 样本的收敛性是一个重要问题.理论上仅仅指出当迭代次数 
m 充分大时收敛发生，而没有对 m 的选择提供具体的指导.许多文献已经建议了 
多种检验 Gibbs 样本收敛性的方法.但它们并没有得出关于哪个方法执行得最好 
的一致 结论. 事实上，没有任何一个可以利用的方法能 ino % 地保证所研究的 Gibbs 
样本对所有的应用都是收 敛的. 检验方法的表现通常依赖于所处理的问题.实际应 
用中必须要注意这一特点.以保证没有明显的对收敛性要求的违背.对收敛性的检 
验方法参见 Carlin and Louis (2000) 以及 Gelmau 等人 (1995). 应用中，以不同的 
初始值重复 Gibbs 抽样几次来保证算法收敛是很重要的. 

12.3 贝叶斯推断 

在 Gibbs 抽样屮条件分布起肴重要的 作用. 在统计文献中，这些条件分布被称 
为条件后验分布 (conditional posterior distributions ). 因为它们是在数据、其他参数 
和一定的模型给定时参数的 分布. 本节将回顾一些在 MCMC 方法中有用的著名的 
后验分布. 

12.3.1 后验分布 

有两种统计推断的力法.第一种方法是基十最大似然原理的经典方法.此时模 
型通过最大化数据的似然涵数进行估计，且利用拟合的模型做出推断.另一种方法 
是贝叶斯推断，它将先验的思想与数据结合得到后验分布，然后基于后验分布进行 
统计推断.历史上，在两类统计推断之间有着激烈的争论，但经证明两种方法都是 
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有用的，而且现在都被广泛接受.到目前为止，本书讨论的方法都属于经典方法.然 
而，对所考虑的所有问题.贝叶斯解都是存在的.近年来随着 MCMC 方法的发展 
尤其如此，这是因为 MCMC 方法大大改善了贝叶斯分析的可行性.读者可以重新 
回顾一下前几章，并导出所考虑问题的 MCMC 解.大多数情形下，贝叶斯解类似于 
我们以前已有的结果.有些情形，贝叶斯解可能优于其他解.例如，考虑第 7 章中 
VaR 的计算，贝叶斯解可以很容易地将 VaR 计算中参数的不确定性考虑在内.然 
而，这种方法要求大强度的计算 - 

令0为所釆用模型的末知参数向量， X 是 数据. 贝叶斯分析寻求将关于参数 
的已获信息与数据相结合来做出 推断. 参数的己获信息通过对参数预先指定一个 
先验分布表示，记为 P (0). 对一个给定的模型，用 f ( X \0) 表不数据的似然函数•由 


条件概率的定义， 


烟 X )= 


no-x) 

nx ) 


f(X\0)P{9) 

/PO 


(12.4) 


这里边际分布可以通过下式得到 


/( X )- f ( X .0) d 0= f ( X \0) P (9) d 0. 


(12.4) 式中的分布 /( fl | X ) 称为0 的后聪 •分布 (posterior distribution ). 一 般来讲，我 
们可以利用贝叶斯准则得到 


f (0\ X ) a f ( X \6) P {0), (12.5) 


其中 P {0) 是先验分布， f ( X \0) 是似然函数•由 （12.5) 式，基于似然函数 f { X \&) 
作出统计推断相当于利用具有固定先验分布的贝叶斯方法. 


12.3.2 共轭先验分布 

一般来讲，得到 (12.4) 式中的后验分布并不是一件简单的事，但是也有先验分 
布与后验分布属丁•同分布族的情形.此类先验分布称为共轭 （ conjugate ) 先验分 
布.对 MCMC 方法 t 使用共轭先验意味着可以得到条件后验分布的个 闭型解 ，然 
后则可以利用通常的概率分布的计算路线得到 Gibbs 样本的随机 抽取. 下面，我 
们回顾一些著名的共轭先验分布.更多的信息，读者可以参考有关贝叶斯统计的书 
(如 DeGroot 1990,第9章). 

结果1 假定 XI ,-.. , x w 是从均值为 / x ( 未知)、方差为 a 2 (已知且为正数）的正态 
分布中抽取的一个随机样本.并假定 P 的先验分布是均值为鄉、方差为4的止态 
分布，则给定数据和先验分布的条件下，//的后验分布是均值为心、方差为 d 的 
正态分布,和 W 由下式给出： 


^ = 


o^/to + 2 

+ nal ， 〜 


a 2 + 
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其中是样木均值. 

i=l 

在贝叶斯分析屮，为力便通常使用精度参数 r / = l / a 2 ( 即方差 a 2 的逆).将先 
验分布的精度参数表示为 r/o = 1/^,后验分布的精度参数表示为％ = 1/4,则结 
采1可以改写为 

V. = m + nv ， = — X /io -I- — X *. 

对所考虑的正态随机样本， 关于# 的数据信息包含进了样本均值屯它是 ^ 的充分 
统计置 • * 的精度为 n / cr 2 二 nr/, 因此，结果1说明 （ a ) 后验分布的精度为先验分布 
的精度和数据的精度 之和； （ b ) 后验均值是先验均值和样本均值的加权平均，权重 
与精度成 正比. 这两个公式也说明了当样本量 n 增加时，先验分布的贡献将降低 • 
涉及线性回归模型时，结果1的一个多元形式在 MCMC 方法中特别有用.参 
见 Box and Tiao (1973). 

结果 ia 假定 , x n 是米自均值向量为 / i 、 已知协方差矩阵为 S 的多元正 
态分布的随机样本.又假定#的先验分布是均值向量为 / iy 协方差矩阵为： E „ 的 
多元正态分布•则/ X 的后验分布也是多元正态的，其均值向量为#、协方差矩阵 
为，且 

E.- 1 = Sf 1 + nS- 1 , /i.= S.(Eq 1 /1o + nS- l x), 

其中 * = E ^ t / n 是样本均值且服从均值为 / a 、 协方差矩阵为 S / n 的多元正态.值 
得注意的 nE - 1 是 i 的精度矩阵，且 S 0 _ l 是先验分布的精度矩阵. 

称一个随机变量^服从具有正参数和0的伽玛分布，如果它的概率密度函 

数为 

f{v\a,0) = Y^V a ~ l ^~ 011 y V > 0, 

这里 r ( Qf ) 为伽马 函数. 对于这个分布， E { j ]) = a /( 3 , var (； 7 ) = a / 0 2 . 

结果 2 假定 an ,- • , x n 是来自给定均值为 / x 、 未知精度为 r ; 的正态分布的随机 
样本.如果的先验分布是具有正参数 ft 和/?的伽玛分布，则 r ； 的后验分布也是 
伽玛分布，其参数分别为 a + in / 2 ) 和/? +它 （a — ^) 2 / 2 . 

称一个随机变量6；服从具有正参数的贝塔分布，如果它的概宇密度函 

数为 

沒的均值为五(设）= a/(a 4 - /?)，方差为 Var (0) = a/?/[(a + / 3 ) 3 (a + 十 1)]. 

结果 3 假定: n , ，％是来自参数为0的伯努利分布的随机样本.如果 (9 的先 
验分布是貝有_定正参数 0 和 g 的贝塔分布，则0的后验分布也是贝塔分布，参 
数分别为 a j « 和 冷 + n - x i ' 

<=i <=i 
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结果4假定 x 1 ,---, x n 是来自参数为 A 的普哇松分布中抽取的随机 样本. 又假 
定入的先验分布是具 f 给定的正参数 u 和/3的伽玛分布，则 A 的后验分布也是伽 
玛分布，参数为 a + ' txi 和 + 

结果5 假定 XX , ••- = ,： r n 是来白参数为 A 的指数分布的随机 样本. 如果 A 的先验 
分布是具有给定正参_ n 和的伽玛分布，则 A 的后验分布也是伽玛分布.参数 
分别为 Q ； + T 1 和/3+ E X i . 

称一个随机变量服从参数为 m 和 A 的负二项分布，这里 m > 0, 0 < A < 1， 
如果它的概率函数为 


p(n|m. A) = 



^ A m (l - A)«, 


若 n = 0,1，…， 
其他. 


金融中负二项分布的一个简单例 于是： 假定应聘者是独立的并且每个应聘者是最 
好人选的概率为 A , 问在一个公司发现对它的 m 个空缺的 m 个“恰当的候选人” 
以前需要面试多少个 MBA 毕业生？用 V 表示全部应聘者的数量，则； f = F - m 
服从参数为 m 和 A 的负二项分布. 

结果6假定 x lt …，〜是来自参数为 m 和 A 的负二项分布的随机样本,这里 m 
是正的，而且是固定的.如果 A 的先验分布是具有给定的正参数《和的贝塔分 
布，则 A 的后验分布也是贝塔分布.参数分别为 a + mn 和 

下面我们考虑貝有未知均值 P 和未知精度7/的正态分布的形.—维的先验 


分布分解为 P (^ v )- P (^\ v ) P ( v )- 

结果7假定 x lt -.- t x n 是来自未知均值为 / i 和未知精度为 r ; 的正态分布的随机 
样本.又假定给定 T / =你下，/ X 的条件分布是均值为柯、精度为叩 卻 的正态分布, 
而且 T / 的边际分布是具有正参数《和的伽玛分布，则给定7/ = 7/0的条件下，0 
的条件后验分布是均值为精度为％的正态分布，且 

To/zo+ni , , v 

/i. = — ^- ，巧 * = (To + njTjo, 

To 十 Tl 


其中 i = f ： Xi / n 是样本均值，且 r ? 的边际后验分布是参数为 a + ( n /2) 和•的 


伽码分布，其中 


0 . 


卢 一 | f (% — 至) 2 + 


t 0 h(x - /ip)^ 
2(ro + n) 


当对随机变量的条件方差感兴趣时.通常使用逆卡方分布（或逆 X 2 ).称随机 
变量 y 服从自由度为”的逆 x 2 分布，如果 i / y 服从自由度为 v 的 x 2 分布 . y 的 
概率密度函数为 


Hv \ v ) 


2- v /2 

W 2) 3 


(v/2 + l) e -l/(3 V ) ? y>Q 
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对于这个分布，我们有：如果 t? > 2 ,则 E{Y) = l/(w-2); 如果 v > 4 ,则 Var(y) =; 
2 /[(v-2) 2 (u-4)]. 

结果8 假定 ai , • • • , a „ 是来自均值为0、方差为 o ' 2 的 IH 态分布的随机样本.又 
假定 d 的先验分布是自由度为 v 的逆 x 2 分布[即， ( vX )/^ - xl 其中 A > 0], 则 
tr 2 的后验分布也是逆 X 2 分布，其自由度为 V + n ， 即 ㈣ a ^/ a 2 ~ xl^rr 


12.4 其他算法 


在许多应用中，条件后验分布没有闭型解但是某些统计文献已经提出了许多 
好的算法来克服这个困难.本节将讨论一些这样的算法. 


12.4.1 Metropolis 算法 


当条件后验分布已知并且不是标准化的常数时， Metropolis 算法是可行的.参 
见 Metropolis 和 Ulam (1949) 以及 Metropolis 等人 (1953). 假设我们希望从分布 
mx) 中抽取一个随机样本.然而它包含了一个复杂的标准化常数，直接抽取要么 
太浪费时间，要么不可行.倌得庆幸的是，存在一个近似分布，利用它可以很容易地 
得到随机抽取. Metropolis 算法就是从近似分布中产生一系列的随机抽取，且其分 
布函数收敛到 f ( 0 \ X ). 此算法如下 进行： 

(1) 抽取一个随机的初始值0。，满足 /(6> 0 | A -) >0. 

(2) 对* = 1,2,…， 

a . 第 i 次迭代时，在给定前面的抽取下，从已知分布中抽取一个候选样 
本0•.用 J t ( 0 t \ 0 t ^) 表示已知分布.在 Gelurnn 等人 (1995) 中称此分布为 
跳跃分布 (jumping distribution ), 也可以称 作建议分布， 这个跳跃分布一定 


是对称的，即对于所有的 0 t , 0 j 和 f ， 有 M 0 i \ ej ) = MOjlOi ). 


b . 计算比率 

c . 设定 



~ m-i\xy 

0 *-, 以概率 min ( r ，1), 
沒 t - i ， 其他. 


在一些正则性条 件下， 序列 { 0t } 依分布收敛到 f[ e\X). 参见 Gelman 等人 


(2003). 


算法的实施要求对所有的0•和 0 t - i 计算比率 y , 从跳跃分布中抽取0.，并 
从均勻分布中抽取一•个随机实现以决定接受或者拒绝 0*. 不需要 f { 9 \ X ) 的标准 
化常数，因为这里只利用比率. 


此算法的接受和拒绝准则可以陈述如下：⑴如果从6^^到 0. 的跳跃增加了 
条件后验密度，则接受 0. 作为钆 ⑻如果这个跳跃降低了密度，则以等于密度比 
r 的概率 设定的 = I ，否则设定= Ot - x . 这个程序看上去是合理的. 
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对称跳跃分布的例子包括均值参数的正态分布和 学生一 * 分布.对给定的协方 
差矩阵，我们有/(0,|^) = 1 ( 9 , 10 ,) ,其中 f ( 6 \ e 0 ) 表示均值向 量为知 的多元正态 
密度函数. 

12.4.2 Metropolis-Hasting 算法 

Hasting (1970) 通过两种方式推广了 Metropolis 算法. 首先，跳跃分布没有必要 
一定是对称的.其次,跳跃准则修正为 

/( 化 ix)m (心队 — 0 

这个修 TH 的算法称为 Metropolis - Hasting 算法. Tierney (1994) 探讨了提高该算法 
计算效率的方法. 

丄 2.4.3 格子 Gibbs 抽样 

在金融应用中，所采用的模型可能包含一些非线性参数 （如： ARMA 模型中 
的滑动平均参数或波动率模型中的 GARCH 参数).因为非线性参数的条件后验 
分布没有闭型表示，所以在这种情形下执行 Gibbs 抽样可能将变得复杂，即使对 
Metropolis - Hasting 算法也是如此.当条件后验分布是1维时， Tanner (1996) 给 
出了一个简单稈序来得到 Gibbs 抽样中的随机抽取.这个方法称 为格子 Gibbs 抽 
样 (Gridriy Gihhs sampler ) 且应用广泛.然而，在实际应用中此方法可能并不有效. 

令① 表示具有条件后验分布 m \ x , 0 . t ) 的纯量参数，其中是剔除0,之 
后的参数向量.例如，如果 (9 — ( H 03 )'，则 0-1 — (02,O 3 y. 格子 Gibbs 抽样进行 
如下： 

(1) 从久的一个恰当选择的区间上选择格子点，记为心彡如 < …彡久 m . 估 
汁条件后验密度函数，得到叼= /((9 0 | X ^_ i ), j = l, ••- , rn ; 

(2) 利用 w ir -, w m 得到逆累积分布函数的一个 近似； 

(3) 抽取一个均勻（0, i ) 随机变量，并通过近似的逆累积分布函数对这个观测 
进行变换，得到氏的一个随机抽取. 

下面依次给出关于格子 Gibbs 抽样的一些注释.首先，并不需要条件后验分 
布 m \ X , 0 . i ) 的标准化常数.因为，逆累积分布函数可以从 { wj }^ 直接得到. 
其次，逆累积分布函数的一个简单近似是 {^>7=1 的离散分布，概‘为 P ( 0 ij ) = 
Wi / E W V . 最后，在实际应用中，参数叭的区间 [ e ilt e im ] 的选择必须仔细检验. 
一 Ytij 1 单的检验程序是考虑的 Gibbs 抽样的直方图.如果该直方图显示久 t 或 
9 xm 周围的概率较大，则必须扩展此区间.然而如果该直方图显示概率集中在区间 
[ 0 n , 0 tm ] 则此区间太宽了，应缩短.如果区间太宽.则格子 Gibbs 抽样变得不是 
很有效，这是因为此时大多数 w 将是 0. 最后，格子 Gibbs 或 Metropolia-IIasting 
算法可以用丁 • Gibb « 抽杵以得到些参数的随机抽取. 
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12.5 带时间序列误差的线性回归 

我们准备考虑 MCMC 方法的一些具体应用.下面几节中讨论的例子只是为了 
说明这些具体 应用. 这里的目标是强调所用方法的应用性和实用性.弄懂这些例子 
有助于读者深入了解 MCMC 方法在金融中的应用. 

第一个例子是估计一个带序列相关误差的回归模型.这是第2章中讨论的一 
个主题.那里我们用 SCA 进行估计.该模型的一个简单形式为 

J/t = A) + p x x u + -. • + 0 k x kt + Z U 
+ o t , 

其中是响应变量；是解释变量,它可能包含奶的延 迟值; &服从简单的 AR (1) 
模型，且 { a t } 是独立同分介的正态随机殳量序列，均值为0、 方差 cr 2 . 用 e = 
(#， 0 ， W 表示这个模型的参数，其中冷=(仇扁，…仇)'，令々=( 1 ,叫,... lXkt y 
为时刻 < 所有回归因子组成的向量，包括一个单位常数.模型变为 

Vt = Xt/3 + 2<, zt = (f)z t -x + 屯 ， f = 1 ， . ■. ， n ， (12.6) 

其中 n 为样本容量. 

^种情形下进行 Gibbs 抽样的一个自然方法是在回归估计和时间序列估计之 
间进行迭代.如果已知这个时间序列模型，则我们可以利用最小二乘方法很容易地 
估计回归 模型. 然而，如果回归模型是已知的，则我们可以利用為=队 - 得到 
时间序列％并利用这个序列估计 AR (1) 模型.因此,我们需要下面的条件后验分 
布： 

/(^| y , x ,/3, a 2 ), /( a 2 in ， 汍0)， 

其中 y iyn y , x 表示解释变量所有观测值的集合. 

我们利用共轭先验分布得到条件后验分布的一个闭型表达.先验分布为 

〜聯 0 ， S 0 ), 伞〜 会〜 X5 ， (12.7) 

这里〜 表示分布，办⑴ S 0 , A ， V ， 釦和4是已知童.在贝叶斯推断中，这些量称为 
超参数 （ hypcrparamcters ). 它们的精确值依赖子要处理的问题.典型地，我们假定 
^0 = 0,如= 0,且 E 0 表示具有很大对角元素的对角阵.同时假定 (12.7) 式中的先 
验分布相互独立，因此，我们可以使用基于参数向量0的分解的独立先验分布. 

条件后验分布 /(/3| r , X ,0, a 2 ) 可以通过 A 3节的结果1 a 得到.具体来讲， 
给定0,我们定义 

yo,t — yt — <ht~u »o,t = — (pxt-\. 

利用 （12.6) 式，我们有 


Vat = ^ ® o,t + a t , t = 2, ••- , 


(12.8) 
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在的假定下， (12.8) 式是一个多元线性回归.因此，关于参数向量的数据信 
息包含在它的最小二乘估计 


\t=2 ) \t=2 t 


中，且这个最小二乘估计具有多元正态分布 


/3^N L9,, 


(厂 *0, t *0,^ 


利用结果 la, 给定数据、 0 以及 <T 2 的条件下 ，尽 的后验分布是多元正态的.我们将 
结果写为 

(12.9) 


其中参数由下式给出 

= 尽 . =S •( 匕口’〜 +奶。) 

下面考虑给定汍 a 2 和数据条件下，0的条件后验 分布. 因为 )9 给定，所以对 
所有的 <，可以计算 2 t =讲考虑 AR (1) 模型 


Zt = <t>Zt—\ + dt^ t = 2,… ， n. 


有关0的似然函数信息包含在最小二乘估计 

中，它服从均值为‘方差 w { t ^ y ] 的正态分布.根据结果1， 0 的后验分布 
也是正态分布，且其均值为 a 为其中 

^ a = E y~ i+g °~ 2 ， ^=^( E y~^+^o) (mo) 


最后，考虑给定/3, 4和数据的条件下， a 2 的后验分布.因为/3和0已知，我们 

可以计算 < 

at — zt- (f>zt-u zt = Vt— /3'aJt, t = 2, • • • , n. 


由 12. 3 节的结果8, W 的后验分布是逆 x 2 分布.即 


( 12 . 11 ) 


其中 xi 表示自由度为的 x 2 分布. 

利用 (12.9) (12.11) 式的三个条件后验分布，我们可以通过 Gibbs 抽样估计 
(12.6) 式,步骤 如下： 
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(1) 在 (12.7) 式中指定先验分布的超参数值； 

(2) 指定/3, 和 o 2 的任意初始值(如不带时间序列误差的/3的普通最小二乘 
估 计)； 

(3) 利用 （12.9) 式的多元正态分布抽取的一个随机 实现； 

⑷利用 (12.10) 式的多元正态分布抽取必的一个随机 实现： 

(5) 利用 (12.11) 式的多元铲分布抽取 ( T 2 的一个随机实现. 

軍复步骤3〜5许多次迭代，得到 Gibbs 样本.然后利用样本均值作为模型 (12.6) 
中参数的点估计. 

例 12.1 为了进一步说明，重温第 2 章中关于美国周利率的例子.数据是从 1962 
年 1 月 5 日到 1999 年 9 月 10 日的固定期限为 1 年和 3 年的国库券利率，且其来 
自于圣路易斯联邦储备银行.因为单位根非平稳性，故独立和不独立的变量为 

(1) C 3 t = »'3 t — 1，为3年期利率的周变化， 

(2) c u = ru ， ri , 卜 1 ，为1年期利率的周变化， 

这里原始的利率以百分比度量.在第2章屮，我们对数据采用了一个带 
MA (1) 误差的线性回归模型.这里我们考虑误差过程为 AR (2) 的模型.利用传统 
方法，我们得到 模型： 

c 3t = 0.000 2 + 0.782 c lt + Zt , z t = 0.205 ^_i - 0.068? t _ 2 + a <, (12.12) 

其中心 = 0.067. (12.12) 式屮系数佔计的标准误差分别为 0.001 7,0.008,0.023 和 
0.023. 除了残差 ACF 在延迟6处的边际显著外，前面的模型看上去是充分的. 
将模型写为 


C3i = Aj -\-0\C\t - I - Zt, Zt = 必 lZt— i + + (12.13) 

其屮{叫}是独立的且服从 iV (0, a 2 ) 的随机变量序列，我们通过 Gibbs 抽样估计参 
数.前面使用的分布为 

〜尺(0, 4 J 2 )， 沴〜 N [0, diag (0.25,0.16)], ( vX )/ a 2 = (10 x 0 . 1 )/< r 2 ~ xio , 

这里 J 2 是 2 x 2 单位矩阵.初始参数估计是通过 OLS 方法得到的（即利用一个两 
步程序，先拟合个线性回归模型，然后对回归残差拟合一个 AR (2) 模型).因为样 
本量1 9郎很大，所以初始估计接近于 （12.12) 式给出的结果.我们重复 Gibbs 抽样 
迭代2 100次，但抛弃前100个迭代结呆.表12-〗给出了参数的后验均值和标准误 
差.图 12- i 给出了每个参数的边际后验分布的直力图. 

我们以不同的初始值重复 Gibbs 抽样，都得到相似的结果. Gibbs 抽样看上去 
是收 敛的. 由表 12- i ， 除了 zt - i 的系数外.后验均值都接近于 (12.12) 式的估计.然 
而， 和扣 的后验标准误差相对较大，显示了这两个估计的不确定性.图 12-1 的 
直方图包含了一些有用的信息.特别地.它们表明心和心的分布并不收敛到渐近 
正态; 分布是右偏的.然而，烏和成的渐近正态性看似是合理的. 
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图 12-1 



02 

模型 （12.13) 的 2 〗0(1次叠代的 Gibbs 抽样直方图.结果基于后 
2 000个叠代，先验分布和初始参数值在前文中已给出 


表 12-1 用2 100次叠代的 Gibbs 抽样来估计的模型 (12.13) 的后验均值和标准误差 * 


参数 

00 

Pi 


<h 

a 

均值 

0.025 

0.784 

0.305 

0.032 

0.074 

铩准 误差 

0.024 

0.009 

0.089 

0.087 

U.0U3 


a 结采基于；5 2000个#代，先验分布 S 在文屮给出. 
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12.6 缺失值和异常值 


本节将讨论处理缺失值和识别可加异常值的 MCMC 方法.令 { t / £ }« =1 表示观 
测到的时间序列.数据点 jm 是一个可加异常值，如果 




若* = / i ， 
其他. 


(12.14) 


这里 o ; 是异常值的大小，是没有异常值的时间序列.可加异常值的例子包 
括记录误差（如打字误差和测量误差).异常值可以严重地影响时间序列分析，因为 
它们可以导致参数估计中的较大偏差，并导致模型的错误指定. 

考虑时间序列而和固定的时阆指标 / i . 我们如果把; r h 当作一个缺失值，则可 
以/解到关于它的很多信息.如果: r t 的模型已知，则给定序列的其他值，我们可以 
推导出办的条件分布.把观测到的 值洲与 以的导出分布相比较，可以决定抓是 
否可以归为可加异常值.具体来讲，如果你是一个很有可能在导出分布下发生的 
值，则不是一个可加异 常值. 然而，如果在导出分布下观测到的机会很小，则 
Vh 可以归类为一个可加异常值.因此，时间序列分析中异常值的识别与缺失值的处 
理基于同样的思想. 

文献中，时间序列的缺失值可以利用 Kalman 滤波或 MCMC 方法处理.参见 
Jones (1980) 第11章以及 McCulloch and Tsay (1994 a ). 异常值识别也被仔细研究 
过.参见 Chang , Tiao and Chen (1988), Tsay (1988), Tsay , Pena and Pankratz (2000) 
及其参考文献.异常值可以按它们对时间序列影响的性质分为四类.这里我们集中 
讨论可加异常值. 


12.6.1 缺失值 


为了表示方便，考虑 AR ( p ) 时间序列 

itt — <t>\x t - x H -4 - <f> p x t ~p I Ot, (12.15) 

其中是均值为0、方差为 a 2 的高斯白噪声 序列. 假定样本区间是从1到 
t = n . 但是 观测办 是缺失的，这里1 < /I < 71 . 我们的目标是在出现缺失值时估计 
模型. 

在这个特例中，参数为= (4/， x h ，( r 2 y ， 其中沴= ( 如 ，…，心/.这样，我们将 
缺失值看作一个未知参数.如果我们假定先验分布为 

洽〜 iV (也， S 0 )， 叫〜 释 0 ,2认 尝 〜 xi 
其中超参数是已知的，则条件后验分布 /( 刮尤抑， 〆 ）和 f { a 2 \ X , x h ,< t >) 正好是 12.5 
节中给出的，其中 X 表示观测到的 数据. 条件后验分布 f { x h \ X ,^ a 2 ) 是均值为 
〜、方差为4的1维正态分布.这两个参数可以利用线性回归模型得到.具体来 
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讲，给定模型和数据，抑仅仅与 ㈨ _ p ，…， otm ，办 +1 ，…，抑 + p } 相关.记住以是 
一个未知参数，我们可以将其中的关系如下写出. 

⑴对《 = 模型为 


— <t>\^h-\ +- h <Pp^h.-p + O/i- 

令 2//i = <h x h-i+. • •+ 飧 p Xh-p，bh = —ah, 则前面的方程可以写成 你 = Xh+bh = 
<hxh + b h , 其中 <Ao = 1. 

(2 〉 对 t = A + l , 我们有 

+ j + • • • 4 - < t> P Xh 11 P -f ah n ， 

令 Vh+l = 郎 +1 — (p2 工 h-i — ... — 且 6h+i = o/»+i . 则前面方程为 

J // i+i = <piXh + bh + i . 

(3) — 般地，对 * = /i + j ， 】• = 1 ，…， p ， 我们有 


x/ l \j= (jiiXh[j i + • • • + 4>j^h + 11 工 fc i + •.. + (fipT-h I j p 4 - dh\j- 

令 Vh+j = Xh+j — 4>iXh+j-l - * — <f>j-lXh + i — ♦j+lXh-l - . . • — 4>pXk+j 一 p 且 

bh+j = ah + j , 前面方程简化为 Vh 4 -j = <}>jXh + bk + j . 

因此，对一个 AR ( p ) 模型，缺失值办通过如下 p + 1 个方程与模型和数据相 
关联， 

Vh+j = < f > j^h + bh + j , J = 0, ••- , p , (12.1 ti ) 


其中加 =1. 因为正态分布关于它的均值对称，所以^和具有同样的分布. 
因此， (12.16) 式是一个具有 p +1 个数据点的特殊的简单线件回归模型 . &的最小 
二乘估计及其方差为 

Var ( ih )= E ^' 




例如，当 p = 1时，我们有紅= ^( x ^+ x ^ O , 称为抑的过滤值.因为高斯 
AR (1) 模型是时间可逆的，所以对工/的两个相邻观测运用等权重得到滤波值. 

最后，利用 12.3 节的结果1，我们得到以的后验分布是均值为方差为4 
的正态分布,其中 


+ ^ o ( Ei=n 0?)^ 2 a 2 al 

。 2 + 卿 =0 呦 ，〜 = /+從 = 。的. 


(12.17) 


缺失值可能成堆发生，导致了多个连续缺失值的情形.这些缺失值可以用两种 
方法处理.第一种，我们可以直接推 r 前面的方法得到多个滤波值的解.例如，考 
虑抑和 X h+1 缺失的情形.这些缺失值与 { 叫 -p ， … ,Xfc_l ； X h+2 ,-.. ，:有 
关.我们可以用与以前同样的方式定义一个响应变童 y h+j , 从而建立一个参数为 
^和 x h +1 的多元线性回归.然后利用最小二乘法得到 办和以 +1 的估计.与指定 
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的先验分布相结合,我们有对 ( x h , x h + l y 的一个二元正态后验分布.在 Gibbs 抽样 
中，这种方法可联合地抽取相连的缺失值.第二，我们可以在 Gibbs 迭代中多次利 
用 （12.17) 式中单个缺失值的结果.再次考虑缺失 :^和 的情形.我们可以分 
别单独地利用后验分布 和 f(xh^\X,Xh,<{>, cr 2 ). 在 Gibbs 抽样 

中，这意味着我们一次抽取一个缺失倌. 

因为 A 和 x k +1 在时间序列中是相关的，所以在 Gihhs 抽样中更愿意联合地 
抽取它们当连续缺失值的数量很大时尤其如此如果缺失值的数量很小，则一次 
抽取一个缺失值可进行得很好. 

注释： 在前面讨论中，我们假定 />.-?> >1且 /i + p < n . 如果接近于样本 
时间区间的终点，则在线性回归模型中可以利用的教据点的教量必须调整. 口 

12.6.2 异常值的识别 

(12.14) 式中可加异常值的识别在 MCMC 框架中变得很直接.除了具有相似 
大小的一堆可加异常值的情形 . McCulloch and Tsay (1994) 的简单 Gibbs 抽样运行 
都很好.参见 Jiist . p |, Pefia and Tsay (2001) 我们再次利用 AR 模型来说明这个问 
题.当利用 MetropoUs - Hasting 算法或格子 Gibbs 抽取非线性参数时，此方法同样 
很好地应用于其他的时间序列模型. 

假定观测到的时间序列为讲，它可能包含位置和大小都未知的一些可加异常 
值.我们将的模型写为 


Ut — A + xu « = l ，."， n , (12.18) 

其中 { M 是独立的伯努利随机变量序列，满足 P ㈧ = l ) = e , P ( S t = 0) = 1 - e , 且 
e 是 0 到 1 之间的常数 . 是来自给定分布的一个独立随机变量序列.另外 ，: 
是无异常值的 AR { p ) 时间序列 

Xt=<t>o-\- <t>\x t -\ H - h <t> p Xt-p-\- at, 

其中 {« t } 是均值为0、方差为 cr 2 的高斯白噪声.虽然这个模型看起来复杂.但是 
它允许可加异常值在每个时间点发生.每一个观测是异常值的机会为 e . 

在模型 (12.18) T , 我们有 n 个数据点，但是有 2 n + p + 3 个参数.即，沴= 
(01)， …, 4 > P )\ S =(占 1， … ，^ »)’， )3 = (/?!,••• ，/? n )'， ct 2 和 t . 二值参数 <5,由 e 控制, 
01 由指定的分布 控制. 参数 <5与0是利用数据扩张的思想引进的 ，札 表示在时刻 
t 异常值出现或不出现 ，而汍 表示当时刻 《 异常值出现时它的大小. 

假定先验分布为 

0~ iV (0 O) J 2 0 ), ^2 e~beta(7i,72), A 〜尋， C 2 ); 

其中超参数是已 知的. 这些^共轭先验分布.为了对具有异常值识别的模型估计实 
施 Gibbs 抽样，我们需要考虑条件后验 分布： 

/( e | 口)， 
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这里1 < /I < n ， y 表示数据 . 0_,表示剔除0的第 i 个元素后的向量. 

在已知 d 和/3的条件下，没有异常值的时间序列可以通过 z t = y t -6 t 0 t 得到， 
数据中关于在的信息包含在它的最小二乘估计 

0= ( ) ( X) x t-i x t ) 

\e=P-fi / V=p+i / 

中，其中 * t _! = (1，^^，…，: r t _ p )' 且合服从多元正态分布，均值为也协方差矩 
阵 ( ^ \ 1 

\/=；^1 / 

因此0的条件后验分布是多元正态的，均值也和协方差矩阵由 （12.9) 式给 
出.其中用办代替汉代替; r 0 ,,. 类似地, o 2 的条件后验分布是逆卡方分布，即 

”入 + ELp+l a t 2 

^2 - Xv 十 (n — p), 

其中 a , = x t ^ sct - x , x t = y t S t 0 t . 

4 的条件后验分布可以如下得到.首先，知仅仅与 { yjjjd 、{6 j}H 
有关联.其中 ， j # / I ，0和 ( T 2 . 更具体来讲，我们有 

Xj =Vj - SjPj, j ^ h. 

其次，可以假定叫有两个可能的值.如果知=1，则 x h = y h - 0 hy 否则, 
Xh = yh - 定义 


Wj = x ) — ( f>o - ( t )\ x * j_ x - < p p x;_ p ,j = h ，... ，/ 1 + p ， 

其中若: / / / i ， 则 < = 巧且邛=抓.叫的两个可能取值给出了下列两种情形. 

情形 I 6 h = 0. 这里第个观测不是一个异常值且 xl = y h = x h . 从而对 
j = h， …， h + p、Wj = aj . 换句话说，我们有 

wj ~ N (0, or 2 ), j = h，，h + p . 

情形 U 知 =1. 现在笫 h 个观测是一个异常值且 x ； = y h = x h +^ h , 此时前 
面定义的％被汍污损了.亊实上，我们有 

wh ~ N (/3 h , tr 2 ), Wj 〜 Ndj - hPh ' a 2 )、jf = / i +1,-.. ,/i + p . 

如果我们定义少 o = —1 且 fpi = < f >“ i = 1，…， p ， 则对 j = /i + 1, • • • , ft + p , 

根据前面的讨论.我们町以概括 如卜： 

情形丨以概率1 - £•，心= 0. 这种情形下，对 j = / I ， • ..，h + p , Wj 〜 AT (0, or 2 ); 
情形 H 以概率 e , = 1，这里对 j = h , … , h -\- p , Wj ^ N (— t { fj - h 0 h ， cr 2 、. 
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因为有 n 个数据点，所以 j 不能大于 n. 令 m = min(n,/i + p), 从而心的后验分布 
为 

= _ taxp [- 十 ^•->,^) 2 /(2<7 a )] _ 

㈣ 十妁⑹ 2 /(2a 2 )j 十 （1 - e) exp [- EJU wJ/(2<7 2 )】. 

(12.19) 

此后验分布仅仅是比较两种情形下似然函数的加权值,而权重是每种情况的概 
率. 

最后.纵的后验分布如下. 

•如果知= 0,则训不是一个异常值，且汍〜 JV (0，《 2 ). 

•如果4 = 1 ，则洲 由大小为纵的异常值污染.前面定义的变量 ％包含了 0 h 
的信息, j = h，h + l ，". ， min(h + p , n ). 具体来讲，对 j . = &， A + 1， …， min (/ i 4- 
P,n), 我们 有％〜 N (-^.. h ^ h , a 2 ). 该信息可以放进如下一个线件回归的框 
架中： 

tVj = 一岭 j-hPh j = h，h +1 ， … ， min(/i 4-p,n). 

因此.这个信息被嵌入到最小二乘估计 


a _ 

Ph ~ tt = h-^U 


m = min(/i + p , n ), 


中，它是均值为纵、方差为 tr 2 /( E ^^ 2 J 的正态分布.由结果1，队的后验分布 
是均值为宄、方差为的 IH 态分布.其中 


~(I2jLh ~^j- h Wj )C 2 2 _ a 2 ^ 2 


例 l 2 . 2 考虑固定期限为 3 年期的美国国库券利率的周变化序列.时间区间为从 
1988年3月18日至1999年9月10日，共有600个观测倌.利率以百分比表示， 
且为例 12. 1中响应变量 c 3< 的子序列.阁 12-2 a 给出了该时间序列的时间图.如 
果对序列采用 AR 模型.则其 PACF (偏自相关函数）建议使用一个 AR (3) 模型，且 
我们得到 


c 3 t = 0.227 f ：3 ,*-i -f 0.006 c 3 , t -2 + 0.114 c 3 (t _ 2 + a t , a 2 = 0.012 8， 

其中系数的标准误差分别为 0.041,0.042 和 0.041. 残差的 LB 统计量为 Q (12) = 
11.4, 它在5%水平下不显著 

下一步利用 Gibbs 抽样来估计这个 AR (3) 模型并同时识别可能的可加异常值. 
所用的先验分布为 

0 〜 i\r(o,o_25J 3 ), 〜 y 7i=5j 72 = 95 ， e = 0 x 
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其中 0.002 56 « a 2 /5 且 f «祕 2 .可加异常值的期望个数为5%.利用初始值 
6 = 0.05, a 2 = 0.012 ，扣 = 0.2, 鈿= 0.02, 0 3 = 0.1, 我们运行 Gibbs 抽样 1 050个 
迭代，但是将前 5() 个迭代的结果去掉.利用系数的后验均值作为参数估计,我们得 
到拟合的模型， 

C 3< = 0.252 c 3, t— 1 + 0.003 c 3, t— 2 + O . IIOC3〆— 2 + at , <r 2 = 0.011 8, 

其中参数的后验标准误差分别为0.046,0.045, 0.046 和 0.000 8. 这样， Gibbe 抽样产 
生的结果与最大似然方法的结果很相似.图 12-2 b 显示了可加异常值的每一个观 
测的后验概率的时间图，且图 12-2 c 画出了异常值大小的后验均值图形.由概率图 
可见，某些观察值是异常值的概率很大.特别地，/= 323的概率为0.83,相应的异 
常值大小的后验均值为 -0.304 .当 C 3 t 从 0.24 变化到 -0.34( 即大约是两星期内周 
利率降低 0. 6% ) 时，这个点刈应于1994年5月20日.异常值的第二个最高后验 
概率的点为 t = 201，对应于1992年1月17日.列出的后验概率为 U .58 且估计的 
异常值大小为 0.176. 在第二个点， c 3< 从 -0.02 变化到 0.33, 对应于周利率的一个 
大约0.35%的跳跃. 


( a ) 利率的周变化 



1988 100(1 1992 1804 1996 1998 2(KX1 

()0 异常侑的后聆概率 



19911 1 卿 I 侧 1»«J6 19UK 2(IOn 

年 

( c ) 异常值大小的后验均值 



1988 199D 1002 19A4 1906 1008 


年 

阁 12-2 固定期限为3年期的美国国库券利率的周变化序列时间图，时间区间是从1988年3 
月18日至1999年9月10 日：⑷数据； （ b ) 异常值的后验 概率； ⑷异常值大小的 
后验均值.估计基于丄050个迭代的 Gibbs 抽样，但前50个迭代被删去了 
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注释：通过 Gibbs 抽样的异常值识别要求高强度的计算.但此方法对模型参 
数和异常值实施了一个联合估计.而传统的异常值辨识方法需要将估计和辨识分 
开.它在计算上更快，但是当存在多个异常值时可能产生错误的辨识.对于例 12.2 
中的数据. SCA 程序也识别了 i = 323和《 = 201作为两个最显著的可加异常值. 
所估计的异常值大小分别为 -0.39 和 0.36. □ 

12.7 随机波动率模型 

MCMC 方法的一个重要的金融应用是估计随机波动率模型.参见 Jacquier , 
Poison and Rossi (1994) 及其参考文献.我们从一个1维随机波动率模型幵始.资 
产收益率 r t 的均值和波动率方程为 

n = A)+/?ix lt +，.. + ^a ： pt+a t , a t = y/h^et, (12.20) 

In / i < = ao + ai In h t -i + v «, (12.21) 

其中 { x it \i =1,- -, p } 是时刻 《 - 1 可以得到的解释变量，内是参数，是均值 
为0、方差为1的卨斯白噪卢序列，也是高斯白噪声序列，其均值为0、方差 
为4且和{叫}是独 立的. 用对数变换以保证对所有是正的.解释变量 
〜可能包含收益率的延迟值（如； r « = n - i ). 在 （12.21) 式中，我们假定 | cn | < 1 
使得对数波动率过程 In ~是平稳.如果有必要 T 可以对 In ~采用更髙阶的 AR ( p ) 
模型. 

记均值方程的系数向量为 /9 = (/3 o ， A ， …，凡)'，波动率方程的参数向量为 a ; = 
( a 0 , a !, a 2 y . 假如 ( n , … , r „ y 是观测到的收益率集合，而 X 是解释变量的集 
合.令 H = (/ lx ,-. - , h n y 表示不可观测的波动率向量.这里/3和 w 是模型的“传 
统”参数.而 H 是一个辅助 变元. 如果通过最大似然估计法对模型进行估计，则很 
复杂，因为似然函数是以下 n . 维 ff 分布的 混合： 

/(R|X,/3,a;) = |/(i?|X ， A«' )f(H\u, )dH. 

然而，在贝叶斯框架下，波动率向量//由扩充参数组成.在 Q 知 / f 的条件下，我 
们可以关注概率分布函数和 f { H \ ui ) 以及先验分布 p {(3, cv ). 假设先 
验分布可以被分解成 p (/3, u ;)= p (/3) P ( u ;), 即均值和波动率方程的先验分布是独立 
的. 要估计 (12.20) 式和 (12.21) 式屮的随机波动率， Gibbs 抽样力法就涉及到从以 
下条件后验分布屮抽取随机 样本： 


f(0\R,X.H,cj), f(H\R.X, P,cj),f(u\R,X,0,H). 


下面.我们给出所用到的 Gibbs 抽样在实际应用中的操作细节. 
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12.7.1 —元模型的估计 

给定 (12.20) 式中的均值方程是一个非齐次的线性回归方程.方程两边同 
时除以 Vh t , 我们可以将模型改写为； 

r 0 , l = x , 0 ^-\-e t yt = ,n, (12.22) 

其中 和 aw = / \/ h t ，且 〜=( l , x lt ，... , x pi )' 是解释变量所组成 

的向量.假设0的先验分布是均值为沐)，协方差矩阵为 A 0 的多元正态分布，则/3 
的后验分布也是多元正态分布，且均值是/3.、协方差矩阵是 A .. 这两个量可以像 
以前一样通过结果 la 得到，它 们是： 

•A* 1 = > : + -^0 1 1 Pm = | 〉 : *0,t^0,t + -^0 1 ， 

e=i \t=i / 

其中，如果 r t _ p 是在解释变量中使用的最大延迟收益率.则和式可理解为从 p +1 
开始求和. 

波动率向量 / f 是逐个元素进行抽样的.必需的条件后验分布是 f { h t \ R , X , 
它是由 a t 的正态分布和波动率的对数正态分布产生的 

f { ht \ R , X r (3 y H . t ^) 
oc f{a t \h t ,rt,xt,(3)f(ht \h t -uu)f{ht+i 
« / if a 5 exp [-( r t - x , t /3) 2 /(2/ i t )]/ i t _1 exp [-( ln / i t - fx t ) 2 /(2 ff 2 )\ 
oc hr 1 ' 5 <? xp [—( r ! — x [/3) 2 /(2 ht ) — (\ nh t — Mt ) 2 /(2< r 2 )] T (12.23) 

其中 / z t = ftt 0 (l - aO + oaGn / it+i + lnU/U + a ?) 且 < r 2 = a^/(l + a ?). 这里我 
们使用了以下 性质： （ a) a< |/u 〜 AT (0，/ i 纟）； （ b ) \ nh t \] nht-i ^ N ( a 0 ^ ai \ nht - i , o ^); 
( c ) hxht+i | ln ~ 〜 N ( a 0 ^-ai ln / n , o ^); ( d ) d \ nh t = h ^ dht , 其中 rf 表示差分算子; 
( e ) 等式 


{x- a) 2 A +( x - b) 2 C ={x- c) 2 {A + C ) + (a - b ) 2 AC/(A + C ), 


其中 c — (Ai + Cb )/{ A -^ C ), 假定 X -4- C ^ 0. 这个等式是 Box and Tiao (1973 t P 
418) 中的引理 1 的一个纯量 版本. 在我们的应用中， + — 

且6 = ( lnht+t - a 0 )/ at . (a - b) 2 AC / { A - i - C ) 不包含随机变量心，从而在条件后验 
分布的导出中被积掉了. Jacquier , Pulsou 和 Rusai (1994) 用 Metropullh 算法来抽取 
h t 的样本.本节我们用格 r Gibbs 抽样，且心的取值范围是 r t 的无条件样本方差 
的倍数. 

为了抽取 U ； 的随机样本，我们将参数分解为 a = 和 u ； 的先验分 

布也可相应地分解[即， p ( w ) = p ( cr ) p (4)]. 我们需要的条件后验分布如下给出. 
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• f ( ct \ Y , XM .(3,( rl ) = f ( a \ H . al )： 给定 / f ， lnfc t 服从 AR ⑴模型.因此. 
在前面两部分讨论的 AR 模型的结果也可在这里应用.特别地.如果《的先 
验分布是均值为 咖、 协方差矩阵为（％的多元正态，则 /( alf /,^2) 是均值为 
a .、 协方差矩阵为（7,的多元正态，且 

= a =c ( S =2 :广 / i 、 c - i ao ^ 

其中 

• /(^ \ Y . X , H ,/3, a ) = f(cxl | H ， a ): 给定 H 和《，我们可以计算 t ， t = ln ^- 
a 0 - or 1 ln / it_ 1 ,t = 2 n 因此.如果 d 的先验分布是 （ mA ) A ^ 〜; d , 则 4 
的条件后验分布就是一个自由度为 m + n - 1的逆卡方分布，即. 

v t 〜 2 

^2 〜 Xm + n — 

注释1: 公式 （12.23) 对于1 < * < rt 成立，其中 n 是样本量.对尸两端的 

数据点心和/»„，需要一些修正.一个简单的方法是假没 / m 是固定的. 这样对 h t 
的抽样就从 * = 2 开始. 对于 t = n ，利用结果 ln / i „ NiVfao + cnln / i … of ). 或者， 
我们可以利用 / in + i 的预測和对 / io 的反向预測，并且继续应用 公式. 因为 / i „ 是所 
关心的变量‘我们运用在预測原点 n - 1的向前2步预測来预測 hn +l . 对于模型 
(12.21)， h n+l 的预測就是 

^7»-1 (2) = ao +ai(ao + In /i n -i). 

对 hu 的反向顼測足基于模型的时间可逆性 

(ln/it -i]) = ai(\nh t ~i - tj) 

其中77 = a 0 /(l — oil ) 和 | ai | < 1. 反向序列的模型是 

( In / i t - ri ) = ai { biht + i - rj )- {- r t *, 

其中 K } 是一个均值为零、方差为 d 的高斯白噪声序列.于是，在《 = 2点对 / t 0 
的两步反向预測就是 

/i2(_2) = Oi(ln/i2 —r)). □ 

注释2:也可以通过使用在 AR (1) 模型的一个缺失的值的结果来得到 （12. 
23) 式（参考 12.6.1 节) • 具体来讲，假定 inh t 是缺 失的. 对于 AR (1) 樸型 (12.21), 
这个缺失值跟 In / i *-! 和 ln / it +1 相关联 （1 < t < n ). 由模型我们有 

In ht = ao + ai In h t ~i + a t . 

定义 .Vt = 十 xt — 1 和 bt = — u t , 我们得到 


Vt = x t In h t + b t . 


( 12 . 24 ) 
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图 12-3 从1962年1月到1999年12月的 S & P 500 指数的月对数收益率的时间图 

例 12.3 考虑从1962年1月到1999年12月的 S & P 500 指数的月对数收益率， 
共456个观测值.图 12-3 给出了收益率（以百分比形式给出）的时间图.如果对该 
序列采用 GAHCH 模型的话，我们得到一个髙斯 GARCH (1,1) 模型 

rt = 0.658 -f a t , a t = \/ h ^ e tl 
h t = 3.349 十 0.086^—+ 0.735/ it _ i , 


接下来，由 

Id = ao + «i In /it 4 - at-j-i, 

我们定义 yt+i = ln / it+i — Qo , x t +i = ai 和 = a (+ i 得到 

j/t+l. = xt+i In "t+i + b t +t. (12.25) 

(12.24) 式和 (12.25) 式构成一个特别简单的含两个观测值和一个未知参数 ln / i < 的 
线性回归.值得注意的是 . 6 t 和 6 t +1 有相同的分布.因为也是服从 N (0, ai ) 
的. \ nh t 的最小二乘回归就是 

^ = x t y t -\r Jt - t - iyt - t-i = ap(l — ai) + ai(ln/^ 十 1 -f lnfej - i ) 

" ~ x 2 t + j ^ +1 ~ 一 iTaf~ 

它正好是在 (12.23) 式中 \ nh t 的条件 均值. 另外，这个估计 p 从正态分布，且均值是 
lnh t 、 方差是 4/( l + a ?). (12.23) 式就是 a t 〜 N (0, h t ) 和 frTh ' 〜 AT [ ln / i t ,^/( l + a ?)] 
的简单相乘再加上一个变换 = 对于 ln / i t 这个回归的方法可以很容 

易地推广到其他 AR .( p ) 模型.我们使用这个方法并且假设 { h t } p t=l 对一个随机波 
动率 AR ( p ) 模型是固定的. □ 

注释3: h t 的初始值可以通过对收益率序列拟合第3幸的波动率模型来得 

到. □ 



#焰老篇犮 


(12.26) 
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其中系数的 /- 比全部都大于 2.52. 标准化残差及其平方序列的 Ljung - Box 统计量 
不能表明模型是不充分的. 

下面，考虑随机波动率模型 

r t = p 十 a t = y / ftttt , 

In /it = a 0 + «1 In / i t _i + u t , (12.27) 

其中 h 是独立同 N (0,^) 分 布的. 为了应用 Gibbs 抽样，我们使用先验分布 
M 〜 N (0, 9), a ~ AT [ a 0 , diag (0.09,0.04)], ~ 

其中 = (0.4,0.8>'. 对于初始参数值，我们使用对 {/ k } 序列拟合 GRACH(U) 模 
型 (12.26) 时的拟合参数，并且令4 = 0.5 和 p = 0.06, 后者为样本均值.另外 ，知 
是用格了 Gibbs 抽样方法使用 S 00 个格点抽样得到的，心的范围是 （0， i .5 s 2 )， 其屮 
P 是对数收益率^的样本方差. 

我们进行 5 10 U 次 Gibbs 抽样，并且丢掉最初的100次抽样结果.图 12-4 所示 
的是 4 个系数参数的先验和后验密度 函数. 所用的先验分布相对包含的信息更少. 
后验分布特别集中在//和4•图 12-5 所示的是拟合波动率的时间图.上面的一幅 
给出/ ~在每个时间点的后验均值，且该后验均值是由5 000次迭代算出的.而 
下面一幅给出了 GARCH (14) 模型 (12.26) 的拟合值.两幅图呈现出一个相似的模 
式. 



图 12*4 对 S & P 5 U 0 指数的月对数收益率数据使用随机波动率模型时参数的先验和后验分布 
密度. 虚线表示先验，实线表示后验，它们由5 0 UU 次 ( Jibbs 重复抽样得到.具体细 
节参考文宇部分 


4个系数的后验均值和标准误差 如下: 
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参数 _ fi _ a ® _ ai _ 

均值 0.836 0.831 0.685 0.265 

标准误差 0.177 0.183 0.069 0.056 


a x 的后验均值是 0. 685,比 Jacquier , Poison , and Rossi (1994) 使用 S & P 500 指 
数的日数据得到的后验均值要小.但是它证实了波动率序列的强依赖性.最后.我 
们使用不同的初始值进行另外一个 Gibba 抽样，并有3 100次迭代.参数的后验均 
值有一点点变化.但是~的后验均值序列是稳定的. 



1970 1980 L 990 2000 

年 


图 12-5 给 S & P 500 指数的月对数收益率数据所拟合波动率的时间图.时间区间是从 1962 年 
到 1999 年.上面的一幅给出了 Gibbs 抽样在每个时间点的后验均值，且该后验均 
值是由 5 001) 次迭代算出，而卜曲一幅给出 f GARCH (1,1) 模型的结果 

12.7.2 多元随机波动率模型 

本一小节用第10章的 Choleaky 分解来研究多元随机波动率模型.我们集中 
研究一元的情形，但是所讨论的方法对更高维数情形同样适用.基于 Cholesky 分 
解.将收益率 n 的新息％变换为满足 


ht = Oit, b-2t = «2t — q2\,tbit, 

其中 k 和的^可以解释为下面线性回归模型的残差和最小二乘估计 


«2t = Q2l.tO.it + b2t- 


a t 的条件协方差矩阵被和 ( 921 . J 参数化为 


戊 11，《 

^12,« 


' 1 0 ' 


Pii ,* 

0 


1 

戊21，《 

^22,< 


• (721,1 1 


n 

<722.1 


0 1 


(12.28) 


其中 tfii.t = Var(6 it |巧- 1 ) 和 丄 & 2t . 于是，我们关心的量为 {jii.t ， 物, t } 和 {to ， t}. 
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一个对于收益率向量 n = ( n t ， r 2 t )' 的简单的二元随机波动率模型 如下： 

rt = Po-^PiXt + at, (12.29) 

=a i0 +Q!ii Ingu,^ 4 - v it , * = 1,2, (12.30) 

921, t =7o + 7i92i.e-i + Ut. (12.31) 

其中 {〜} 是.列无序列相关性的高斯随机向量，其屮均值为零、条件协方差矩阵 
^由（士 28 )式给出 ，外 是一个二维的常数向量，心表示解释变童. {r lt }，{ v2t } 和 
{叫}是三个独立的髙斯白噪声序列，满足 Var (叫 ） =吃和 Var(u t ) = 另外， 
我们在（I 2 . 30) 式屮使用对数变换使得％， t 为正. 

令 == Uu , l ,--., ffn . n) ， ,G = [ Gi , G 2 ] 和卩= (921, l ，“.， g 21， n )'. 模型 (12.29) — 
(12.31) 中“传统的”参数是 /3 =(汍，内)，岣= ( a i 0 , a iU crl)i = 1,2和 7 = 
( To . lii 0 ^)- 扩充参数为 Q . Gi , Go . 为了用 Gibbs 抽样法估计这样一个二元随 
机波动率模型.我们使用前一小节一元模型的结果和另外两个条件后验分布.具体 
来讲,我们可以抽得下面的样本 

⑴/3 0 和 A 的逐行样本.使用结果 （12.22) 式； 

⑵ an, t , 使用方程 (12.23), 只要将 a t 换成 a u; 

(3) 使用与一元情形同样的方法， 只是将 a t 换成 a lf . 

为了抽得 u； 2 和仍 2 』的样本，我们需要计算而这是很容易的，因为给定扩 
充参数向量 Q 后，&« = a 2t -q 2hl a u . 进一步，服从正态分布，且其均值为0、条 
件方差为522, <• 

卜曲只需要考虑条件后验分布 


/(afjQ.w), f(q 2 ltt \A,G, Q_ t , 7 ), 

其中 w = ( 7 o ,7 iV 是 （ l 2 . 31) 式屮的系数向量，并且 >4表示 a , 的集合，当 
和 A 给定的时候,它是已知的.给定 Q 和 M ， 模型 (12.31) 是一个简单 
的髙斯 AH (1) 模型.于是，如果的先验分布是均值为 ter 。、 协方差矩阵为£) 0 的 
二元止态分布.那么 U 7 的条件后验分布也是二元正态的.且均值为 U 7 •、协方差矩 
阵为这里 

其中 A = 类似地.如果4的先验分布为 （ mA )/4 〜么，那么的 

条件后验分布为 

饥入 + z)r=2 u t 2 

a 2 〜龙 m + n-l 
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其中 Ut = q2i,i — 70 ~ 7 i 92 i ( t - i * 最后， 

f(q2u\A,G,Q_ n( rlv7) (12.32) 

IX f(b2t |<722,t)/(</21,e |92l,t- 1. tx7. )/(921,t+l \q21,t^,(^t) 

oc g^f exp[-(a 2 < - 72i,tait) 2 /(2fl 22>t )] exp[-(g 2 i,t - Mi) 2 /( 2 o- 2 )], 

其中 = [7o(l — Ti) 十 7 i ( 仍 l , 卜 i 十 92 i , t + i)]/(l 十 7?) 和 0 " 2 = a u/(^ + 7?)- 般地. 
叫和 a 2 可以通过使用在 AR ( p ) 中的缺失值的结果来 得到. 可以证明 （12.32) 式对 
于有闭型分布.具体来讲， (12.32) 式的第一项（即给定仍 2 ,t 和％的条件下， 
g 21 , t 的条件分布）是正态的，且其均值为 a 2t / a lt , 方差为 g 2 2,t/a 2 lv (12.32) 式的第 
二项也是正态的.其均值为内、方差为，于是，由 12.3 节的结果1, g 21 ， t 的条件 
后验分布是正态的,且均值为方差为这里 

其中 Mt 由 (12.32) 式定义 . 

例 12.4 本例研究 IBM 股票和 S & P 500 指数的月对数收益率数据的二元波动 
率模型.时间区间是从 1962 年 1 月到 1999 年 12 月.这是一个例 12.3 的扩 
充版本，加入了 TRM 股票数据•图 12-6 所示的是这两个收益率序列的时间图. 
令 - ( IBM t , SP t ) / . 如果采用第10章中的经过 Cholesky 分解的时变相关系数 
GARCH 模型，我们得到模型 

9 A)-\ 

^ 1 叫 

r n - 
启-1(卜 
- 20 - 
-30- 


10 - 

J - 10 - 
一 20- 


图 12-6 从1962年到1999年的 IBM 股票和 S & P 500 指数的月收益牟 
对数收益率的时间图 （ a ) IBM 股票； （ b ) S & P 500 指数 


( a ) LBM 




LB 70 1080 1000 

年 

( b ) S_0 指数 

» 

2000 



i I I 1 ~ 

1070 1980 1090 2000 

年 
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r t = 0 o -\-a t , (12.33) 

9u,t = ono + 4- (12.34) 

022,t = 020 + (12.35) 

921 ,(! =7o, (12.36) 

其中估计及其标准误差由表 12-2a 给出.为了比较，我们使用与 (12.33) 式同样的均 
值方程和个与 (12.34)—(12.36) 式相似的随机波动率模型.波动率方程是 

In 9 n,t = aio + a；iiln Var ( i * u ) = a ?,” (12.37) 

In g 22% t = at 20 + V 2 t, Var(v 2 t) = cr^ v , (12.38) 

921 ,t 一 70 + '«t» Var(wt) = a^. (12.39) 

使用的先验分布是 


0io 〜 ^(0.8 f 4), a, ~ AT [(04,0.8) , , diag (0.16,0.04)1, a 20 〜 iV (5,25), 

\r/n /t n 10 x 0.1 o 5 x 0.2 o 5 x 0.2 n 
7o 〜 AT(0.4,0.4), - x ?。，—2 - ^xl —2 - 

这些先验分布相对来说包含的信息更少.我们进行 Gibbs 抽样1 300次迭代， 
但是丢掉前300次的迭代结果•你, t 的随机样本是用400个格点的格子 Gibbs 抽样 
抽得的.抽样区间为[0,1.5$，其中4是对数收益率 n , 的样本方差.表 12 -2 b 给 
出了二元随机波动率模型的“传统 '• 参数的后验均倌和标准误差. 

表 12-2 IBM 股票和 S&P500 指数的月 M 数收益率数据的二元波动率模型估计.时间 
区间是从 1962 年 1 月到 1999 年 12 月 ' 


(a) 带时变自相关系数的-•元 GARCH(l.l) 模型 


参数 




^^391 


— w 

— 



估计 

1.04 

0.79 

3.16 

0.83 

0.10 





标准差 

0.31 

0.20 

1.67 

0.08 




KriW 


( b ) 随机波动率模甩 

参数 

Aji 

002 

«io 

mi 


«20 

a lv 

70 


后验均值 

0.86 

0.84 

0.52 

0.86 

0.08 

1.81 

0.39 

0.39 - 

0.08 

标准差 

0.30 

o.ia 

0.18 

0.05 

0,03 

0.11 

0.06 

0.03 

0.02 


»随机波动率模兜其 f 1 two 次迭代 Gibba 抽样，迭代总次数为 1 300次. 


为了检验 Gibbs 抽样的收敛性：我们运行此过程若千次，每次用不同的初始值 
和不同的迭代次数，结果是稳定的.图 117 描出了两个不同 Gibbs 抽样过程的各 
种量的散点图第一个 Gibbs 抽样是基于 300 + 1 000 次迭 代的； 第二个 Gibbs 抽 
样是基于 5 00 + 3 000 次迭代的，其中 M + N 表示一共进行 M + N 次迭代 t 但 
是将丟掉前 M 次迭代的结果.散点图分别对应于 gi\,t.922.t.q2l,t^022,t,021,t 的后验 
均值和相关系数 P2l ,t. 在每幅图上添加直线 y -X 是为了表现后验均值的相近程 
度. Gibbs 抽样结果的稳定性是显然的. 
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m 12-7 给 IBM 股票和 S & P 5 DO 指数的月对数收益率所建立的一.元随机波动率模型的两种不 
同的 Gihhs 抽样的各种统计量的后验均值的散点图 . X - 轴表示基于500+3 000次 
迭代的结果 .1/- 轴表示某于300+1 000次迭代的结果.记号如文中所述 

比较下（12. 33 ) — (12.30) 式中带时变相关系数的 GARCII 模型和随机波 
动率模型是有意思的.第，如所料想，这两个模型的均值方程在本质上是样的. 
第二，图 12-8 给出了 IBM 股票收益率的拟合波动率的时间图.图 12-8 a 是对应 
于 GAKCH 模型的，图 12.8 b 给出了随机波动率模型的后验均值.这两个模型呈现 
相似的波动率 特征： 他们呈现出波动率聚集现象.并且在波动率屮有一个上升的趋 
势. 然而， GARCH 模型生成更高的波动率峰值.第三，图 12-9 给出了为 S & P 50 U 
指数收益率所拟合波动率的时 间图. GARCH 模型在1993年附近产生了一个额外 
的波动率峰值.这个额外的峰值没有在图 12-5 中的一元分析中 出现. 看上去对十 
这个特殊的例子，二元 GARCH 模型生成的是一个假的波动率峰值.这个假的峰值 
是由对 IBM 收益率的依赖性引起的，而且并没有在随机波动率模型中出现.实际 
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1980 UIUU 2(^)0 

年 

图 12-9 给 IBM 股票和 S&P500 指数月对数收益率数据所拟合相关系数的时间图，时间 K 
间是从 1962 年到 1999 年 ： （a) 带时变相关系数的 GARCH 模型; (b) 运用 Gibbs 抽 
样器重复迭代 300 + 丨 000 次估计出来的随机波动率模型 


图 12-8 给 IBM 股票月对数收益率数据所拟合波动率的时间图，时间区间是从1962年到 
I " 9 年： （ a ) 带时变相关系数的 GARCH 模型; （ b ) 运用 Gibbs 抽样器重复迭代300 
+ 

1 000次估计出来的随机波动率模型 


上, S & P 500 指数收益率用二元随机波动率模型得出的拟合波动率与一元分析得出 
的结果相似.第四，图 12-10 给出了拟合条件相关系数的时间图.日该阁表明两个 
模型有本质区别. GARCH 模型的相关系数相对平滑而且是正的，且其均值为 0.55 
和标准误差为 0.11. 然而，由随机波动率模型产生的相关系数在不同的月份有显著 
的不同，并且其均值为 0. 57、标准误差为 0. 17. 而且，在一些孤立的情况下相关 
系数还是负数这个差异是可以理解的，因为在随机波动率模型中，内 u 包含了随 
机扰动叫- 


(a) 带时变相关系数的 GARCH 
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(b ) 随机波动率 
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(n) 带时变相关系数的 (MUCH 
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(b) 随机波动率模型 




lo()8()GO402()oloo'80'60'40'20 

1 1 0S 


I 


m80.S4020 
# 1 — 


12080GO4021-) 










12 章马尔可夫链蒙特卡罗方法及其应用 


注释： Gibbs 抽样估计法对于其他二元随机波动率模型同样适用.但所需的 
条件后脍分布是本节讨论的条件后验分布的推广，不过它们基于相同的 想法.口 

( n ) 带时变相关系数的 GARCH 



图 12-10 给 S & P 500 指数月对数收益率数据所拟合波动率的时间图，时间区间是从1962年 
到1999年： （ a ) 带时变相关系数的 GARCH 模型： （ b ) 运用 Gibbs 抽样器重复迭代 
300 + 1 000次估计出来的随机波动率模型 


12.8 估计随机波动率模型的新方法 


本节吋论估 il 随机波动率模型的另外种方法.该方法利用了片尔曼滤波框 
架下的向 前德波 (forward filtering ) 和向 后抽样 (backward sampling )( FFBS ) 技术来 
提髙 Gibbs 抽样的效率.利用混合正态分布联合抽取波动率过程能够大大地缩短 
计算时间.事实上，该方法可以用来估计许多带杠杆效应和跳跃的随机扩散模型. 

为了方便陈述.我们将一元随机波动率模型 （12.20) 和 （12.21) 改写为如下形 

• 

r t = xJ/3-t - <r 0 exp ( 晉 ) 4 ， (12.4U) 

Zt+i =azt + r/t, (12.41) 

其中 q 0 = (/ b ，/3 u ". ,0 P Y , era > 0, { zt } 是零均值对数波动 

率序列 ，目伶 J 和是二元 m 态分布序列，且其均值为0、协方差矩阵为 



参数 P 是 Q 和的相关系数.代表资产收益序列 n 的杠杆故应 (leverage effect ). 
具有代表性的是，若 P 是负的，则表示负收益率，这往往会增大资产价格的波动率. 

比较模型 （12.20) 和 (12.21), 我们有々= ln / i t — lnog 且 og = exp { E [ ln /^}. 
即， A 是均值调整后的对数波动率序列.这种新参数化表示有一些好的性质.例 
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如.波动率序列 a 0 exp ( zt /2) 永远是正的.更为重要的是，项是 2 , +1 的新息并且与 
独立. 这个简单的时间移动使我们能够处理杠杆效应.如果假定 （12. 4 〗）式为 
z t = a 2 t-i + 印，则 Q 和研不可能相关，因为非零相关系数意味着 （ 12. 40) 式中 q 
和价是相关的.这将导致辨识性问题. 

注释：另外，可以将随机波劫率模型写为 

n = xi/3-h a 0 exp 味 

z t = azt-i +rft, 

其中 (£ t , VtY 与以前一样，服从二元正态分布.另外还有一个等价的参教化 方式： 
n = x' t !3 -h exp ( 专 •) 

Z t = aZ t-l 

其中 E # = oro/(l — a )， 不为 0. q 

在模型 （12.40) 和 （1241) 中，波动率模型的参数是沐勿， a , p ，（7 r ，和 z = 
( A ， , ZnY ， 其中 n 为样 本量. 为了 简便. 假定 q 己知.通过 MCMC 力法估计这 
些参数需要其条件后验分布.接下来，我们将 i 、 J 论所需要的条件后验分布 • 

(1) 给定1勿和正态先验分布，具有与 12.7.1 节相同的后验分布，只是把 
( 12 - 22 ) 式中的 VV 用 a 0 exp ( 2 t / 2 ) 代替. 

( 2 ) 给定; r 和％, «只是一个简单的 AH (1) 系数. 于是，利用近似的正态先验 
分布很快可以得到《的条件后验分布，参见 12.7.1 节. 

( 3 ) 给定0和 2 ,定义 t， t = (7 *t - 3^/3)6耶(-為/ 2 ) = .于是 { Vt } 是一列独立 
同分布的正态随机变量，且均值为0、方差为4.若4的先验分布为 mX/crU 
则4的后验分布为自由度为 m + 71的逆 x 2 分布，即 

rnA + ELN 2 

⑷给定汍 勿 ， z 和我们可以很容易地得到二元新息/^ = ( et>r)t )\ t = 
2,…， n . 很快可以得到 ( p .^) 的似然函数为 

心 4) =立/⑼岡《1别-("-”’ 2 哪 

nc |5]|-("- D /2 exp 令 ( S - 1 ， 

其中 tr(A) 表示矩阵 A 的迹. 然而，该联合分布非常复杂，因为 ^ 和#不能分离. 
我们采用 Jacquier, Poison, and Rossi (2004) 的技巧，将协方差矩阵进行如下的重 
新参 数化： 

S = I par v ^ 1 <fi 

. P a v I *P tu + v? 2 
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其中 a ; = 4(1 — p 2 ). 容易看出，|53| = u ; 且 


其中 S 只包含 p 令 e = ( e 2 ,... , E n y 和= ( e 2 ,. •. , e n / 为模型 （12.40) 和 (12.41) 
的新息.则似然函数变为（只保留与参数有关的 项)： 

£(( p ) uj ) uuj ~ ( ' n ~ 1 ^ 2 exp (_^- tr ( S 7?)). 

其中 H = (e, 77 /( 6 , 77 ) 是新息的 2 x 2 交叉乘枳矩阵.为了简便.我 

们使用共辆验分布使得 u 服从超参数为 {偉、儀 的逆伽玛 （ IG ) 分布，即 
0^10(7。/2, 71 /2)且#|^~叫 0 ，^/ 2 〉.经过一些代数运算 (< P ， uj ) 的联合后验分布 
可以分解为正态分布和逆伽玛分布.具休来讲， 

V )~ iV ^ l w /(2 + e / c )] 1 

其中妥= e '»?/(2 + e ’ e ) 且 

w 〜 IG[(n 十 1 十 70)/2, {71 + *7^? - (e / ij) a /(2 + e.'e)}/2\. 

在 Gibbs 抽样中，一旦得到#和 o ;, 我们便可以很容易得到^和这是因为 
# = W 十 V ? 2 , P = ip / a v . 值得注意的是，若随机变量 u ； 服从 lG ( a ,0) 分布，则其概 
率密度函数为 

/( u /| a ,/3) - p ^ y u; ~ (Q+1)cx P (~ w ) 1 ^ > 0, 

其中 a >2 R (3>0. 

(5) 最后，考虑给定数据和其他参数的条件下，对数波动率2的联合分布.由 
(12.40) 式,我们有 //av , 

因此， 令 Vt = ln[(rt- xW / a ^ l 我们有 

yt = zt + G ：, (12.42) 


其中 4 = la ( ef ). 由于 ef 〜忒 从而 4 不服从正态分布.将 (12.42) 式作为观测方 
程， (12.41) 式作为状态方程,我们就可以得到状态空间模型的形式，只是 < 不再服 
从正态分布.参见第 11 章的 (11.25) 式和 （11.24) 式.为了克服非正态带来的困难， 
Kim ， Sh 印 hard 和 Chib (1998) 利用 7 种正态分布的混合来逼近的分布.具体来 
讲，我们有 7 

鄭 “4), 
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其中 Pi ，/ x , 和 W 由表 I 2 - 3 给出，也可以参见 Chib , Nardari 和 Shophard (2002). 

为了说明近似的充分件，阁给出了 4 的密度函数（实线）以及表 i 2 -3 
中给出的7种正态分布的混合的密度函数（虚 线). 这些密度是用模拟得到的，共有 
100 000 个观测.由图可以看出， 7 种正态分布的混合逼近得非常好 • 


表 12-3 7种正态分布 


构成 i 

概率 

均值 

方差 4 

1 

0.1 XJ 73 U 

-11.4004 

5.7960 

2 

0.10556 

-5.2432 

2.6137 

3 

0.00002 

-9.8373 

5.1795 

4 

0.04395 

1.5075 

0.1674 

5 

0.34001 

一 0.6510 

0.6401 

6 

0.24566 

0.5248 

0.3402 

7 

0.25750 

一 2.3586 

1.2626 



图 i 2 -ll log ( x ?) 的密度函数（实线)，7种正态分布的混合的 
密度函数（虚 线). 结果基于100 000个观测 

为什么高斯状态空间模型如此重要呢？答 案是： 这样一个髙斯模型能够使我们 
联合有效地抽取对数波动率序列 t 为了弄清楚这一点，考虑卜述特殊的高斯状态 
空间模型，其中和 e t 是不相关的（即没有杠杆效 应)： 

十氓 , rjt ~ iid iV(0,o^), (12.43) 

讲 - c * + 科十灼， e t ~ fnd . N ( 0 , H t ) (12.44) 

其中，假定 ( c t , H t ) 取表 12-3 中的（叫，4)(对应某个0,这将在后面看到.对于这 
个特定的状态空间模型.卡尔曼滤波算法 如下： 

v i = Vt- Vt\t-\ =Vt-C t - 
^ = -f fTt, 

z nt=Zi\t-i 

= — E < | t _ 1 V r f _1 E i | t _ 1l 


(12.45) 
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St+i|* = tt 2 Stn + 

其中 Vi = Var ( vt ) 是 j / t 在给定 G-i = ( yi , … , yt - i ) 条件下的向前 1 步预测误差 
v t 的方差， 2 #和 Sy , 分别是状态变量勺在给定6条件下的条件均值和条件方 
差.参见第11章中对于卡尔曼滤波的 讨论. 


向前滤波和向后抽样 ( FFBS ) 

令 p (4 F „) 为 z 在给定收益率数据和其他参数条件下的条件联合后验分布，这 
黾为了 简便，条件集合中省略了参数.我们可以将分布分解为 

P (2| F „) =尸(22, 23, ... ， « n | F n ) 

=p{Zn K)p(*n-a|*n-li «n* ^n) - - .P (勿 I 洛 3, ... ， ^K) 

=p(z n \F n )p{z n -i\z n ,F n )p{Zn-2\Zn-uFn) … P(22|z 3 , 凡)， （ 12.46) 

最后一个等号成立是因为 (12.43) 式中的 2 t 是马尔可夫过程，因此在 G 知 z t+1 的 
条件下 ， 4与 ^ t +j u > 1) 是独立的. 

由 （12.45) 式的片尔曼滤波知， p ( z n \ Fn ) 是正态的，且其均值为~„、方差为 
S nlM . 接下来考虑 (12.46) 式的第二项 p ^^ lzn ^ n ). 我们有 

p {. Z n — i \ z n , F n ) = p ( Zn — i | Zri > ^ n -1 > Vn ) = p { z n—l | 2 rn -^ n—li v n)i (12.47) 

其中 v n - y n - 是的向前 1 步预测误差•由 (12.43) 式和 （12.44) 式的状 
态空间模型知知 - I 与 W 独立. 因此 

P (^ rt — l\ z ny ^ n ) = P { z n—\\ z rn Fri — l )- (12.48) 


这是一个很重要的性质，因为它意味着通过第11章的定理 11.1, 可以由在给定 R t 
条件下 (z n -i,z n ) 的联合分布来推导出后验分布 p ( 2 T ,_ iK „ F u ). 首先，在高斯假定 
下联合分布是二元正态的.其次，在给定 F n -, 的条件下， { Zn - X ^ n ) 的条件均值和 
条件方差可以很容易地从 (12.45) 式的卡尔曼滤波算法中得到.具体来讲，我们有 

之 n — 1 

2„ 


〜 N 1 

2 n—l|n —1 


V 

. 之 n|r* — 1 • 



^ n —1| t »— 
1| ti - 


l | n - 
^n|n—1 


(12.49) 


其中方差可以通过如下步骤得到 ：（ i ) 在 (12.43) 式两端同时乘以 Z „-1； ( U ) 取条件 
期望.值得注意的是， （12.49) 式中所涉及到的所有量都可以由卡尔曼滤波得到.因 
此，由定理 11.1. 我们有 


p ( 2 n _ l | Zn , F n ) - N ^ n - uK - l )^ (12.50) 


其中 


Mn -1 =2 n - l | n-l + a S „- l | n - l ^ n | t l _ i( 2: rt — 2 n | n - l)t 
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接卜'來对于条件后验分布 p{Zn-2\Zn-l,F n ), 我们有 

P(*^n—2|-2n —li ^n) = P(-2n—?|^n—L» 2i 2/n- 1 ， Z/n) 

( 怎 n-2| 芯 n-l ， ^n-2i 似 n - 1, V n ) 

= p ( Zn - 2 |^- i ,> n ^2) - 

因此,与前面一样，可以由二元正态分布 p ( z n 2 , Z n 机) 得到 P (〜 —— 
般地,我们有 

p(zt\zt+i,F n ) =p(i t | 2 i+1) F<), 1 < f < n. 

此外，由卡尔曼滤波, p (化 2 t +1 | F t ) 是二元正态的且 


2* 

〜 iV ([郇 


^tl* 



為 +1 

F t VL z t+i\t. 




J 


因此， 

〜； V(/z: ， Sn ， 

其中 1 

Mt* = *t|t + aS t | t E^ 1 1(t (^ 4 . 1 - 2t +1 | t ), 

s r = s tit - 

前面的推导意味着，我们可以通过递归方法，利用由卡尔曼滤波得到的己知量 
联合抽取波动宇序列; 5. 也就是说，给定初始值 qo 和 S 1|() ，利用 (12.45) 式的卡尔曼 
滤波将收益率数据向前推移，然后利用向后递归的方法抽取波动率序列 2 的一个实 
现.此方法称为向 前滤波 (fui ward filtering ) 和向 后抽样 (backward sampling )( FFBS ). 
参见 Carter and Kolui (1994) 以及 FYiihwirth-Schnatter (1994). 由十波动率序列是 
序列相关的，故联合抽取序列更加有效. 

注释： FFBS 方法适用于一般的线性高斯状态空间模型主要思想是利用樸 
型的马尔可夫性和状态转移方程的结构，使得 

P(^t\St+\ y F n ) = p(St\S t -i-i, Ft, t ； e+i, • - - ,v„) = p(5<|5 t+ i, Ft), 

其中 S * 是< 时刻的状态向量，％是向前1步预測误差.该等式使得我们能够利用 
定理 11.1 推导出一个递归的方法来联合抽取状态向 口 
再回到随机波动率模型的估计.如同在 （12 . 42) 式中一样， 今 yt = ^ _ 
*^) 2 /^]-为了实现 FFDS . 我们必须确定 (12.44) 式中的 q 和 // t ， 使得止态分布 
的混合能够对 < 的分布提供一个很好的 近似. 为此，我们用一列独立的指示变量 
W 来扩充模型，其中对于每个£， / t 在 {1,... ，7}中取值，满足 PAsi ) = p w 且 
= 1 - 实际中，在已知{々}的条件下，我们可以按如下方法确定 c< 和执 .令 
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qu = ^[{yt - z t - i = i ，."，7, 


其 中叫和 ％分别是表 12-3 中所给出的正态分布的均值和标准误差.少 (.） 表示标 
准止态随机变量的累积分布 函数. 概率仙是给定 y t 和 a 的条件下，的似然函 
数.表 12-3 中的概率 P , 构成了 A 的先验 分布. 因此，的后验分布为 


Pit ， 


Piqit 

pm 


i = 1, … ，7. 


我们可以利用该后验分布抽取 A 的一个实现.如果随机抽取是/« = i 则定义 
c t = / ij . H ( = w ]. 综上所述，在己知收益率数据和模型其他参数的条件下，我们利 
用 (12.43) 式和 (12.44) 式中近似的线性高斯状态空间模型来联合抽取对数波动率 
序列; 2. 我们发现这样得到的 Gibbs 抽样在估计一兀波动率模型时是有效的 • 

另一方面， (12.42) 式所渉及的平力变换不能保持化和^的相关性（如果有的 
话)，这使得 （12.43) 式和 (12.44) 式中近似的状态空间模型不能佔计杠杆效应.为 
了克服这个不足, Artigas 和 Tsay (2004) 建议使用时变状态空间模型来保持杠杆效 
应.具体来讲，当时.我们有 


Vt _ P^t) 


其中 W 是与独立的正态随机变量且 Var ( r ? ?) = ^( l -^ 2 ). 于是 （1!2. 43) 式的 
状态转移方程变为 

Zt-^l = OZt p<T v + 77 :. 


将 ==• ( l / cro)(rf — * J /9) exp (— Zt /2) 代入，我们得到 

办十 1 =叫+ ^ ” # 色卿(-灸/2) + 甙 

oo 

= G(zt) + r ]； 


(1*2.52) 


其中 G ( zt ) = dz t - I - pfTr)(rt — x ' t 0) exp (— Zt /2)/ tro - 对于状态变量 A 而言，这是一■个 
非线性转移方程. （12.45) 式的卡尔曼滤波不再 适用. 为了克服该闲难， Artigas 和 
Tsay (2004) 用时变线性卡尔曼滤波来逼近该系统.具体来讲 ， （12. 妨） 式的最后两 


个等式改为 


(12.53) 


其中 g ( zt \ t ) = 3 G ( x )/ 次 rl *^, 是 G ( z t ) 的一阶浮数在平滑状态处的取值. 

例 12.5 为了演示 FFBS 方法：我们考虑 S & P 500 指数的月对数收益率，时阆区间 
是从1962年1月到2004年11月，共有515个观测•图 12-12 给出了对数 S & P 500 
指数和对数收益率的时间图 • 原始数据来自雅虎金融网站•令^表示月对数收益 
率.我们考虑两个如下形式的随机波动率模型 
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r t =n^a 0 exp(z t /2) e t , e t 〜 iW iV(0,1), 

—oiZt r)t, rjt 〜 Hd A^(0.<r^). 

在模型 1 中，{心}和 { m } 是两个独立的高斯白噪声 序列. 也就是说，该模型中没有 
杠杆效应.在模型 2 中，我们假定 coTT(e t ,n t ) = p, 这代表杠杆效应. 



年 

( h ) 对败收益串 



年 

图 12*12 月 S&P500 指数的时间图，时间区间是从1962年I月到 
2 004年11月： （a) 对数指数 序列； （b) 对数收益率序列 


我们通过 FFBS 方法用 Matlab 的程序估计模型.进行了 2 000+8【)00次 Gibba 
迭代，前2 000次迭代被刪去了.表 U - 4 给出了参数估计的后验均值和后验标准误 
差.允其是.我们有/5= -0.39, 非常接近于文献中经常看到的值.图 12-13 给出了 
后验均值和被估波动率的时 间图. 如所料想，两个波动率序列非常靠近.与例 12 . 3 
那里的序列更短的结果相比，被估波动率序列呈现出相似的形式和相同的幅度.注 
意图 I 2 5 给出的波动率是对数收益率百分比的条件方差.而图 i 2 _ 13 是对数收益 
率的条件标准误差. 


表12^4对于 S & P 500 指数的月对数收益率，利用带 FFBS 算法的 Gibbs 抽样拟合随 
机波动率模型 (12.54) 时的估计 & 



标准误差 0.027 9 0.026 6 0.116 4 0.378 3 

a 结果基于2 0Q0+8 000次 Gibbs 迭代，前2 000次迭代被删除广 
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图 12-13 利用随机波动率 模型为 S & P 500 指数月对数收益率所估计的波动率, 时间区 间是从 

1962年1月到2004年11月： （ a ) 带杠杆 效应； （ b ) 不带杠杆效应 


12.9 马尔可夫转换模型 

马尔可夫转换模型是又一个用 MCMC 方法比用其他传统似然方法有更多优 
势的计童经济学模型. McCulloch 和 Tsay (1994) 讨论了一个 Gibbs 抽枰方法来估 
计在每一个状态的随机波动率都是小随时间变化的 模型. 他们为美囡实际国民生 
产总值的季度增长率（已做季节性调整）建立了一个对小冋的状态带有不同的动态 
机制和均值水平的 Markov 转换模型，并用他们的方法去估计，从而得到一些有趣 
的结果.例如，在经济扩张期和经济紧缩期，增长率的动态变化有明显的不同.由于 
本章关注的是资产收益率.故我们集中考虑模型的波动率转换 • 

假定资产收益率 r , 服从一个简单的两个状态的转换模型.该模型有不同的风 
险溢价和不同的 GARCH 动态 机制： 

{ A \/^7+ s / ht£ t ,ht = «io + ai2a ?- ii 若 st = (12 55) 

\/ htEt , ht = «20 + «21 + «22«<_11 若 = 2， 

其中叫 一 Vhc ^ { s t } 是均值为0、方差为1的高斯白噪声序列，参数叫满足一 
些正则性条件使得〜的无条件方差存在从一个状态到另一个状态的概率转移由 
下式确定 

P ( s t = 2| fl t _ 1 = 1) = c a , P ( s t ^ = 2) = e 2 , (12.56) 

这里 0 < < 1. —个小 e , 意味着收益率序列倾向于在同一状态 /: 逗留，期望 

持续时间为1/〜对 (12.55) 式中的待识别模型，我们 假定冼 > 氏，使得状态2与 
更高的风险溢价相联系.这并不是一个关键性的限制，因为它用来得到状态的唯一 
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标记. 模型的一个特殊情形是对所有的= a 2j ， 即对所有的状态都假定一个 
GAR . CH 模型.然而，如果用沐代替 队 孤' 则模型 (12.55) 简化为简单的马尔可 
夫转换 GARCH 模型. 

模型 (12.55) 是一个马尔可夫转换 GARCH - M 模型.为了简便，我们假定心 
的初始波动率是给定的，其值等于 r , 的样本方差.一个更加熟练的分析是将/^作 
为一个参数，并与其他参数联合估计.我们认为在大多数应用中固定/ n 所带来的 
效应都可以忽略，尤其当样本暈很大时.马尔可夫转换 GARCH - M 模型的“传统” 
参数为 0 oti = ( ntio ^ iucu^yii = 1, 2,且转移概宇为 e ， ( e a > e 2 ) / . 状态 

向 M S 包含了扩张 参数. 如果给定和状态向量5,则波 

动率向量可以递推地 计算. 

梭型 (12.55) 中收益率对波动率的依赖蕴含了收益率也是序列相关的，这样该 
模型在收益率方面具有一些可预测性.然而，将来收益率的状态是未知的，而且由 
模型产生的预测必须是所有状态配置上那些预测的一个混合.这通常导致未来收益 
率的点预测具有较髙的不确定性. 

下面考虑估计.模型 (12.55) 屮的似然函数是复杂的，因为它是所有可能的状 
态配置的一个混合.然而 Gibbs 抽样法仅仅要求如下的条件后验分布 


f^\R. S, H, « 2 ) ， f(oti\R, S.H, 

P{S\R, Iii,a\,a2), f(ei\S), * = 1 , 2 . 

这里 H 是观测收益率的 集合. 为了简便，我们利用 12.3 节讨论的共轭先验分布，即 
0i 〜 N(J3 i(h of 0 ), e< 〜 Beta^n ^ i2 ). 

参数的先验分布在一个恰当指定的区间上是均匀的•因为是似然函数的非 
线性 参数. 我们利用格子 Gibbs 抽样来抽取其随机实现.均匀先验分布简化了所涉 
及到的 计算. 下面给出了条件后验分布的细节， 

(1) A 的后验分布仅仅依赖于处于状态 i 中数据，定义 

U = i 0，其他， 


则我们有 


Tit = Pi + £t, St = i . 


因此，数据关于啟的信息包含在 r « 的样本均值之中.令 ri = ^ T , r itj 这里 

的求和是对处于状态 * 的所有数据点 求和， n , 是处于状态 i 的数 ilk 的个数.于是 
Pi 的条件后验分布的均值为贫、方差为 of ，， 其中 
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(2) 下一步,参数 r ⑷ 可以利用格子 Gibbs 方法逐个抽取. 给定 h u S ， 和 
# j)， 则的条件后验分布并不对应于一个著名的分布，但是它可以很容易 

地估计，因为 

若 st = i ， 则 /(aij|.) oc h t + — —I, 

Sg—i 

其中~含有我们对一个恰当指定的区间上的一列格点估II•这个函数.例 
如0彡 0(11 < 1 — £>12. 

(3) e t 的条件后验分布只涉及 S. 令6表示在 S 屮从状态1到状态 2 转换的 
个数,〖2表示从状态2到状态1转换的个数，再令 n t 表示处于状态的数据点的 
个数.则由共轭先验分布的结果3, q 的后验分布是 beta( 7 n +心，7« +叫 - 心). 

(4) 最后， S 中元素可以逐个抽取.令 S— 表示将 S 中去掉~之后得到的向 

量.给定与其他信息，可以假定〜有两种可能 （即勺 =1 或勺 = 2)，且它的 
条件后验分布为 n 

t=j 

概率 p( Si = i \ S . j ) = P{ 8j = i|s i _ l ,« i+ i) 1 » = 1,2, 可以由 (12.56) 式的马尔可夫 
转移概率计算.另外,假定~ = i, 则对《 >义可以递推地计算相关的似然函数 
用 L ( 3 j ) 表示，它由下式给出，对 i = 1， 2 ， 

L{sj = 0 = n a fji = -I- ^-1 . 

t=j t^j L J 

上式中，如果 = 1, 则 a t = n - 否则， a t = r t - 因此， 〜 =1 的条 

件后验分布为 

P{8j ， 1 |.) 

__ P( g j = l| a j 1» s j I = 1) _ 

— P(sj = 1 |. Sj _ i , Sj + x )L(sj = 1) + P(sj = 2\ sj - i , Sj ^) L(sj = 2) 

从而状态~可以利用单位区间 [U，l] 上的均匀分布很容易抽取 • 

注释：因为当 e 〗 和 e 2 都很小时，心与 s i + i 是高度相关的，所以联合抽取几 
个~更加 有效. 然而，随着联合抽取状态数 f 的增加，状态涉及的计算也可能快速 
增加. 口 

例 12.6 本例中，我们考虑 General Electric 公司从1926年1月至1999年12月 
的月对数收益率,共有888个观测.该收益率用百分比表示，并在图 12-14 a 中给出. 
为了比较.我们对序列以一个 GARCH-M 模型开始，得到 

rt =0.182 \/^t + o.ty — 

h t =0.546 + 1.740/i,_i - 0.775/i t _ 2 + 0.025a^_j. (12.57) 
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n 是月对数收益率. {e t } 是均值为0、方差为1的独立髙斯白噪声序列.所有参数 
的估计都是高度显著的，其 p 值都小于 0. 000 6. 标准化残差及其平方的 L-B 统计 
量没能表明任何的模型不充 分性. 这重新保证了风险溢价是正的，而且是显著的. 
GARCH 模型 （12.57) 可以写为 

(1 - 1.7655 4 - 0.775S 2 )a? = 0.546 + (1 - 0.0255)^, 

其中 Vt = a ^- fH , B 是向后推移算于， 满足 Ba 卜 a 2 t _ v 如同第3章中讨论的，上 
述方程可以认为是平方序列 < 的一个带非齐次新息的 ARMA(2,1) 模型 • AR 多 
项式可以因式分解为 （1 - 0.9455)(1- 0.8205), 这表明它具有两个小于1的实特征 
根.因此， r< 的尤条件方差有限，且等于 0.546/(1 - 1.765 + 0.775) « 49.64. 

现在来考虑马尔可夫转换 模型. 我们利用下面的先验 分布： 

( 3 \ ~ ^(0.3,0.09), 汍〜 iV (1.3,0.09), ~ Beta (5,95). 

初始参数值为 （a) e,- = 0.1; (b) 是一个貝有等概率的伯努利实验，〜是用初始转 
移概韦产生的 序列； （c) = (1.0,0.6,0.2/ , = (2,0.7,0.1) # . a {j 是用具有 40() 个 
格点的格子 Gibbs 抽取的.格子点在下面范围是等间 隔的： 

ttio e [0,6.0], aa 6 [0,1], a i2 F [0,0.5]. 

另外，对于 i = 1， 2, 我们实施限制 a,1 < 1. Gibbs 抽样进行 5 000 + 2 000 次 

迭代，但是仅用最后2 000次迭代的结果来进行推断. 


(») 以百分比表示的月对败收益宇 



年 


图 12-14 (a) GE 股票从1926年到1999年的月对数收益率的时 间图; (b) 处于状态2的后 

验概率的时间图，基于共有5 000+2 000次迭代的 Gibbs 抽样的后2 000次迭代 
产生的 结果. 所用模型是两状态的 Markov 转换 GARCH-M 模型 
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表12^5给出了 (12-55) 式中马尔可夫转换 GARGH - M 模型参数的后验均值 
和后验标准误差.特别地,它也包含了一些可以说明两状态之间差别的统计量，如 
0 = 风险溢价之差在5%的水平下是统计显著的.两个状态的波动率参数的 

后验均值之差看上去并不显著，而波动率参数的后验分布显示了一些不同的特征. 
图12~15和图 12-16 给出了马尔可夫转换 GARCH - M 模型中所有参数的直方图.它 
们展示了两状态之间的某种差别，图 12-17 显示了两状态的持续参数 + c ^的 
时间图.它说明了状态1的持续参数频繁地到达边界1 0,但状态 2 却不如此•两 
状态的期望持续时间分别是11个月和 9 个月•图 以 - Ub 显示了每个观测处在状 
态2的后验概率. 


表 12-5 给 GE 股累从 192 tt 年1月到1999年12月的月对数收益率拟合的马尔可夫 
转换 GARCH - M 模型 n 





msm 
















状态 2 

参数 

02 

e2 

»20 

«21 

a22 

后验均值 

0.247 

0.112 

2.740 

0.869 

0.068 

耵验标 准误茇 

0.050 

0.014 

1.073 

0.031 

0.024 

状态之 M 的箬 

参数 

02 

C2 — ei 

Ot20 一 «10 

otai 一 an 

OC22 - «12 

后验均值 

0.135 

0.023 

0.670 

0.026 

-0.064 

后验标准误差 

0.063 

0.019 

1.608 

0.050 

0.043 


U 所示数字逬基于5 000+2 000次迭代的 Gibbs 抽样的参败的后验均值和后验标准 误差前 5 000 
次的结果舍去.先验分布和先验参数估计值在文中给出 • 



02 «*2 

图 12-15 对于 GE 股票从1926年到1999年的月对数收益率，拟合两状态马尔可夫转换 
GARCH - M 模型的转移概率和风险溢价的直方图.结果基于共有5 000+2 ()00 次 
迭代的 Gibbs 抽样的后2 000次迭代 
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图 12-16 对于 GE 股票从 1926 年到 1999 年的月对数收益率，拟合两状态马尔可夫转换 
GARCH-M 模型的波动率参数估计的直 方图. 结果基于共有5 000+2 000次迭代 
的 Gibbs 抽样的后2 000次迭代 

(a) 状态1 

1 . 00 - 
蘇 0.9 G - 

§ 0 . 00 - 

m 

M50.86- 
030- 


500 


1000 

迭代 

( b ) 状态2 


1500 


2(100 


阁 12-17 对于 GE 股票从1926年到1999年的月对数收益举，拟合两状态马尔可夫转换 
GARCH - M 模型的持续参数 〜 I 的时间图.结果基子共有5 000+2 ()00 次 

迭代的 Gibbs 抽样的后2000次迭代 

最后，我们比较分别由简单 GARCH - M 模型 (12.57) 和马尔可大转换 GAKCH - 
M 模型 (12.55) 所拟合的波动率 序列. 两个拟合波动率序列（图 12-18) 呈现了相似 
的模式，且与平方对数收益率的行为一致.简单 GARCH - M 模型产生了具有较低波 
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图 12-18 对于 GE 股票从1926年到1999年的月刘数收益率,所拟合的波动率序列的时间 
图： （ a ) 对数收益率的 平方； （ b ) GARCH - M 模型 (12.57); ( c ) 两状态马尔可大转换 
GARCH-M 模型 （12.55) 

12.10 预 测 

MCMC 框架下的预测很容易进行.这个方法就是在每个 Gibbs 迭代中利用拟 
合的模型产生预测期的样本.从某种意义上，这里的预测是利用拟合的模型来模拟 
预测期的实现.我们利用一元随机波动率模型来说明该方法，其他模型的预测可以 
利用同样的方法得到. 

考虑随机波动率模型 （12.20) 和 （12.21). 假定可以得到 n 个收益率，且我们对 
预测收益率 rVM 和波动率心+,感兴趣 （i = 1,--. £>0).假定 (12.20) 式中的 

解释变量 a : it 在预测期或者可以得到或者可以按顺序预测.在 MCMC 框架下，模 
型的估计是通过 Gibbs 抽样进行的，从它们的条件后验分布中迭代地抽取参数值. 
将第 j •次 Gibbs 迭代中的参数表示为/^ = … a , = (« 0 o ，叫 j '和 

^ tJ . 换言之， 在第 j 次 Gibbs 迭代中，模型为 

r = A),i + 0\, j x \t + …+ 0 p , j x pt + a ti (12.58) 

ln/»t = oqj -I- aij In ht-x 4- v tl Var(i ； t) = ajj. (12.59) 
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我们可以利用这个模型来产生 tVh 和/ ^^(1 = 1,...,/) 的一个实现并将模拟的实 
现分别表示为 7 VK 』 •和 h nUJ . 这些实现通过如下步骤 产生： 

•从中抽取一个随机样本，利用 (12.59) 式计算 h n+itj ; 

•从 iV (0,1) 中抽取一个随机样本〜 +1 ，得到 a n+1J = v ^ T ~ e n+1 , 并利用 
(12.58) 式计算 r n+lti . 

•对 n + i , i = 2, • • • , ( 按顺序重复前面的两个步骤. 

如果在模型估计中运行 Af + AT 个迭代的 Gibbs 抽样.则我们仅仅需要计算最后 
N 个迭代的预测.这样就得到了 rvn 和心 +< 的一个随机样本.更具体来讲,我们 
得到 

可以利用这两个随机样本进行推断.例如，收益率 r n + , 和波动率 h n+i 的点预测 
就是这两个随机样本的样本均值.类似地，可以利用样本标准误差作为预测误差的 
力差.为了提髙波动率预测中计算的有效性，可以利用重点抽样.参见 Gelrnan ， 
Carlin , Stern and Rubin (2003). 

例 12.7 ( 例 12.3 的续）作为说明，我们考虑 S & P 500 指数从 1962 年至 1999 年的 
月对数收益率序列.表 12-6 给出了收益率及其波动率的以 1999 年 12 月为预测原 
点的向前 5 步点预测. GARCH 模型 （12.26) 与随机波动率模型 (12.27) 都用来预 
测. GARCH ( l . l ) 模型的波动率预测随着预测时间区间的加大而渐近地增加至无条 
件方差 3.349/(1 - 0.086 - 0.735) = 18.78. 用随机波动率模型得到的波动率预测值 
比用 GARCH 模型得到的预测值高.这是可以理解的，因为随机波动率模型产生预 
测时考虑了参数的不确定性.相比而言， GARCH 模型假定参数固定，且在 （12. 26) 
式中给出.这是一个重要的差别，也是 GARCH 模型与衍生产品定价得到的隐含波 
动率相比可能低估波动率的一个原因. 


表 12-6 S&P500 指数从 1962 年 1 月至 1999 年 12 月的月对数收益率的波动率预测， 

预测原点是 1999 年 12 月 11 


预测步长 

1 

2 

3 

4 

5 

对败收益率 

GARCH 

0.66 

0.66 

0.66 

0.66 

n .66 Q 

SVM 

0.53 

0.78 

0.92 

0.88 

0.84 

波动率 

GARCH 

17.95 

18.12 

18.24 

18.34 

18.42 

SVM 

19.31 

19.3 G 

19.35 

19.65 

20.13 


a 随机波动率模型的预测是由 2 000+2 000 次迭代的 Gibbs 抽扦得到的. 


注释： 除了在预测中考虑了参数不确定性这一优势外， MCMC 方法还有效 
地产生了所研究波动车的一个可预测分布.预測分布比简单的点预测包含了更多信 
息. 例如，它可以用来得到 VaR 计算中所需要的分位數. n 
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12.11 其他应用 

MCMC 方法对许多其他的金融问题也是适用的.例如， Zhang , Russell and 
Tsay (2000) 用它来分析买卖报价中的信息决定性， McmiUloch and Tsay (12001) 用 
此方法来对 IBM 交易数据估计了一个等级 模型. Eraker (2001), Elerian,Chib and 
Shephard (2001) 用它来估计扩散方程.这个方程在 VaR 计算中也是有用的，因为 
它提供了估计预测分布的一个自然 方法. 主要的问题不是这个方法是否在大多数 
金融应用中都可以利用，而是方法可以变得多么 有效. 只有时间和经验可以提供该 
问题一个充分答案. 


练习题 

12.1 假设 z 服从均值为 M 、 方差为4的正态分布.同时假定 p 的先验分布也是正态分布，且均 
值为0、方差为 25. 给定数据点 ar , M 的后验分布是什么？ 

12.2 考虑 12.5 节中带时间序列误差的线性回归模型. 假定々 是一个 AR ( p ) 过程（即 a = 
+ 令沴=(也,...表示 AR 参数向量.假设共辆先验分布 
为卢〜 JV (/3 0 , Eo ),<^~ A -(^ 0 , Ao ),( uA )/< t 3 - x », 导出条件后验分布 f(/3\Y,X,<f),a 2 ) t 
/(別广叉，/9^ 2 )和 f { rx 2 \ Y , X , 0 r 4 >)- 

12.3 考虑 12.6.1 节中的线性 AR ( p ) 模型. 假定: r h 和 x h +1 是两个缺失值，它们的联合先验 
分布是均值为 Mo 、 协方差矩阵为 S n 的止态分布.其他的先验分介如本章屮 所述. 两个缺 
失值的条件后验分布是什么？ 

12.4 考虑 General Motors 股票从1950年到1999年的月对数收益率的000个观测值. 

( a ) 对此序列建立个 GARCH 模型； 

( b ) 对此序列建立一个随机波动率 模型； 

( c ) 比较并讨论两个波动率模钽 . 

12.5 对 Ciaco SyBtems 股票从1991年1月到1"9年 I 2 月的闩对数收益率值建立一个随机 
波动率模樹.你可以从 CRSP 数据库或文件 “ d - csco 9 l ". txt ” 中下载数据.利用所建 
的模型得到以1999年12月为预测匾点的向前1步的波动率预测分布. M 后，用所得到 
的预测分布计算下一交易日的100万美元多头头寸的概率为 0. 01的 VaR 值. 

12.6 对 General Motors 股票和 S & P 500 指数的月对数收益率建立一个二元波动率 模型. 样本 
区间从1950年1月到1999年12月.讨论两个波动率过程的关系，并计算 GM 股票的 
时变 beta . 
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谱分解 ，346 
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期望不足 （expected shortfall , ES ), 285 

期望收益率, 258 

前馈神经网络，1邱 

敲定价格，85 

确定性函数，332 
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日开盘价，125 

弱平稳的，21 

上确羿范数，161 

神经网络 ， 146 

时变相关模型，402 

时间 T 方根法则，255 

收盘价，125 

收益率的似然函数，15 

收益率水平，275 
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双线性模型，137 

双重指数分布 . 240 
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随机游动， 56 
讨厌参数，165 
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条件似然法，47 
条件似然函数，94 
条件异方差模型，85 

条件异方差 ARMA ( CHARMA ) 模型， 
115 

条件 MLE , 320 
跳跃扩散模型 . 240 
统计因子分析，371 
危险率函数，214 
韦布尔分布, 213 
维纳过程，220 
稳定分布，13 
稳定状态，456 


无条件峰度，92 
现值，4 
线性的，135 

线性高斯状态空间模型 （linear Gaussian 
state-space model ), 425 
线性时间序列 ， 27 
线性相依性，296 
向后抽样，502 
向后推移算子，31 
向 S 自回归模型，302 
向童 AR ( p ) 模型，306 
向前滤波 ， 502 
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协整，330 
协整检验，334 
协整 VAR 模型，330 
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序列相关系数，21 
选择规则，37 
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训练网络，157 
哑变量，88 
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一般极值分布, 263 
一步延迟自协方差，183 
伊藤过程，223 
伊藤引理，223 
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因于波动率模型，412 
因子模型，353 
因子旋转，374 
预测，41 
预测比较，158 
预测功效，172 
预测误差，258 

再投影 （ reprojection ) 方法，246 
涨-跌平价公式，232 




正定矩阵， 345 
正规差分化, 65 
正交，346 
正态分布，13 
正态分布的尺度混合，14 
指数分布，211 
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周末效应，88 
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转移概率， 144 
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资产收益率, 2 

自回归滑动平均 （ ARMA ) 模型，49 
自回归求和滑动平均 ( ARIMA ) 模型，59 
自回归条件持续期 ( ACD ) 模型，199 
自相关系数，21 
最大似然法，265 
最大似然估计，94, 333 
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最高价，125 
伽玛分布，212 
伽玛函数，94, 212 

A 带常数均值方程的高斯 GARCH (1,1) 
模型，129 

Akaike 信息准则，36 
Aoki 方法，447 
AR 模型，28 
ARCH 效应，91 

B - S 微分方程，四9 


BDS 统计量，161 
BEKK 模型，391 

U 对 IBM 股票月对数收益率的 AR(1)- 
EGARCH(1, 1) 模型， 130 
Cholesky 分解， 395 

Dickey-Puller 检验，60 
Donsker 定理，222 
Durbin-Watson 统计童 ， 74 

GARCH-M 模型， 108 
Gibbs 抽样， 473 

Harvey 方法，446 

IGARCH 模型，107 

Kalman 滤波，118 
Krnnerkfir 直积，347 

Laplacian 分布，240 
Ljung-Box 统计量 ， 74 

Metropolis - Hasting 算法， 480 
Metropolis 算法 ， 479 

PACF(partial autocorrelation function , 
偏自相关函数 )，308 

RESET 检验， 163 

SsfPack , 437 

TAR-F 检验， 166 
TGARCH 模型， 114 
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